Nvidia is the latest tech giant to face allegations that it used copyrighted works to train AI models without obtaining the permission of the authors.
یک اقدام کلاسی پیشنهادی طرح دعوی در دادگاه [PDF] filed against the GPU supremo in San Francisco on Friday March 8 claims the company used copyrighted material to train large language models in the Megatron library for its NeMo generative AI framework.
The complaint was filed by three authors, Abdi Nazemian, Brian Keene, and Stewart O’Nan, who claim that books they wrote were among the material used to train the Megatron LLMs.
From the court filing, it appears that Nvidia is not accused of overtly copying the work of the authors itself, but instead using a dataset to train the Megatron models that was known to contain a number of unlicensed copyrighted works.
The lawsuit refers specifically to models that Nvidia released in September 2022, namely NeMo Megatron-GPT 1.3B, NeMo Megatron-GPT 5B, NeMo Megatron-GPT 20B, and NeMo Megatron-T5 3B.
These are hosted on the website operated by AI outfit در آغوش کشیدن صورت, along with information about each model, including its training dataset. In this case, the information states that the models were trained on “The Pile” dataset prepared by EleutherAI.
The Pile is described as “an 800GB Dataset of Diverse Text for Language Modeling,” and one of its constituent parts is a collection of books called Books3, which contains the contents of about 196,640 books, including those created by the three authors.
According to the court filing, the Books3 dataset was available separately on Hugging Face until October 2023, when it was removed because it “is defunct and no longer accessible due to reported copyright infringement.”
The authors want the case to proceed as a class action, with themselves serving as class representatives, and are asking for a jury trial and for damages for the alleged violations of their copyrights.
در یک بیانیه فرستاده شده به ثبت نام, an Nvidia spokesperson said: “We respect the rights of all content creators and believe we created NeMo in full compliance with copyright law.”
This isn’t the first case of an AI company being sued over accusations of copyright infringement regarding the data used to train AI models. In December last year, The New York Times launched a case against Microsoft and OpenAI over claims the pair had used its articles without permission to build ChatGPT and similar models.
That case was perhaps made more interesting by OpenAI’s assertion in January that it would be “impossible” to build top-tier neural networks that meet today’s needs without using people’s copyrighted works.
Meanwhile, Nvidia is still priming the AI pump with the announcement of a new professional certification in generative AI to help developers to establish technical credibility in this area.
Set to become available to coincide with the Santa Clara-based giant’s GTC event later this month, the professional certification program will offer two associate-level generative AI accreditations, focusing on proficiency in large language models and multimodal workflow skills. ®
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://go.theregister.com/feed/www.theregister.com/2024/03/11/authors_file_lawsuit_to_torpedo/
- :است
- :نه
- 1
- 2022
- 2023
- 7
- 8
- a
- درباره ما
- در دسترس
- اتهامات
- متهم
- عمل
- در برابر
- AI
- مدل های هوش مصنوعی
- معرفی
- اتهامات
- ادعا شده است
- در امتداد
- در میان
- an
- و
- خبر
- ظاهر می شود
- هستند
- محدوده
- مقالات
- AS
- خواهان
- نویسندگان
- در دسترس
- BE
- زیرا
- شدن
- بودن
- باور
- کتاب
- برایان
- ساختن
- اما
- by
- نام
- مورد
- گواهی
- GPT چت
- ادعا
- ادعای
- کلاس
- فعالیت کلاسی
- CO
- مجموعه
- شرکت
- شکایت
- انطباق
- جزء اصلی
- شامل
- شامل
- محتوا
- سازندگان محتوا
- محتویات
- کپی برداری
- حق چاپ
- نقض قوانین حق تکثیر
- حق
- دادگاه
- تشکیل پرونده
- ایجاد شده
- سازندگان
- اعتبار
- داده ها
- دسامبر
- منقرض شده
- شرح داده شده
- توسعه دهندگان
- مختلف
- دو
- هر
- ایجاد
- واقعه
- چهره
- پرونده
- واصل
- بایگانی
- نام خانوادگی
- تمرکز
- برای
- فرانسیسکو
- جمعه
- کامل
- مولد
- هوش مصنوعی مولد
- غول
- GPU
- بود
- کمک
- میزبانی
- HTTPS
- غیر ممکن
- in
- از جمله
- اطلاعات
- نقض
- در عوض
- جالب
- نیست
- IT
- ITS
- خود
- ژانویه
- JPG
- شناخته شده
- زبان
- بزرگ
- نام
- پارسال
- بعد
- آخرین
- راه اندازی
- قانون
- طرح دعوی در دادگاه
- کتابخانه
- دیگر
- ساخته
- مارس
- ماده
- دیدار
- مایکروسافت
- مدل
- مدل سازی
- مدل
- ماه
- بیش
- از جمله
- نیازهای
- عصبی
- جدید
- نیویورک
- نیویورک تایمز
- نه
- عدد
- کارت گرافیک Nvidia
- بدست آوردن
- اکتبر
- of
- ارائه
- on
- ONE
- OpenAI
- عمل
- روی
- جفت
- بخش
- مردم
- شاید
- اجازه
- افلاطون
- هوش داده افلاطون
- PlatoData
- آماده شده
- ادامه
- حرفه ای
- پیشنهاد شده
- تلمبه
- اشاره دارد
- با توجه
- منتشر شد
- حذف شده
- گزارش
- نمایندگان
- احترام
- حقوق
- s
- سعید
- سان
- سان فرانسیسکو
- سانتا
- فرستاده
- سپتامبر
- خدمت
- مشابه
- مهارت ها
- به طور خاص
- سخنگوی
- بیانیه
- ایالات
- استوارت
- هنوز
- شکایت
- فن آوری
- غول فناوری
- فنی
- متن
- که
- La
- اطلاعات
- نیویورک تایمز
- شان
- خودشان
- آنها
- این
- کسانی که
- سه
- بار
- به
- امروز
- قطار
- آموزش دیده
- آموزش
- محاکمه
- دو
- تا
- استفاده
- با استفاده از
- نقض
- می خواهم
- بود
- we
- سایت اینترنتی
- بود
- چه زمانی
- که
- WHO
- اراده
- با
- بدون
- مهاجرت کاری
- گردش کار
- با این نسخهها کار
- خواهد بود
- نوشت
- سال
- نیویورک
- زفیرنت