رفع المؤلفون دعوى قضائية بشأن حقوق الطبع والنشر إلى نسف NeMo من Nvidia

رفع المؤلفون دعوى قضائية بشأن حقوق الطبع والنشر إلى نسف NeMo من Nvidia

رفع المؤلفون دعوى قضائية بشأن حقوق الطبع والنشر لنسف ذكاء بيانات NeMo PlatoBlockchain من Nvidia. البحث العمودي. منظمة العفو الدولية.

تعد Nvidia أحدث شركة تقنية عملاقة تواجه مزاعم بأنها استخدمت أعمالًا محمية بحقوق الطبع والنشر لتدريب نماذج الذكاء الاصطناعي دون الحصول على إذن من المؤلفين.

إجراء جماعي مقترح دعوى قضائية [PDF] تم رفع دعوى ضد GPU العليا في سان فرانسيسكو يوم الجمعة 8 مارس تدعي أن الشركة استخدمت مواد محمية بحقوق الطبع والنشر لتدريب نماذج لغوية كبيرة في مكتبة ميجاترون من أجلها. إطار عمل NeMo التوليدي للذكاء الاصطناعي.

تم تقديم الشكوى من قبل ثلاثة مؤلفين، عبدي ناظميان، وبريان كين، وستيوارت أونان، الذين يزعمون أن الكتب التي ألفوها كانت من بين المواد المستخدمة لتدريب ميجاترون LLMs.

من ملف المحكمة، يبدو أن Nvidia ليست متهمة بنسخ أعمال المؤلفين بشكل علني، ولكن بدلاً من ذلك تستخدم مجموعة بيانات لتدريب نماذج Megatron التي كان من المعروف أنها تحتوي على عدد من الأعمال المحمية بحقوق الطبع والنشر غير المرخصة.

تشير الدعوى القضائية على وجه التحديد إلى النماذج التي أطلقتها Nvidia في سبتمبر 2022، وهي NeMo Megatron-GPT 1.3B وNeMo Megatron-GPT 5B وNeMo Megatron-GPT 20B وNeMo Megatron-T5 3B.

تتم استضافتها على الموقع الإلكتروني الذي تديره منظمة الذكاء الاصطناعي وجه يعانقبالإضافة إلى معلومات حول كل نموذج، بما في ذلك مجموعة بيانات التدريب الخاصة به. في هذه الحالة، تشير المعلومات إلى أنه تم تدريب النماذج على مجموعة بيانات "The Pile" التي أعدتها شركة EleutherAI.

توصف The Pile بأنها "مجموعة بيانات بحجم 800 جيجابايت من النصوص المتنوعة لنمذجة اللغة"، وأحد الأجزاء المكونة لها عبارة عن مجموعة من الكتب تسمى Books3، والتي تحتوي على محتويات حوالي 196,640 كتابًا، بما في ذلك الكتب التي أنشأها المؤلفون الثلاثة.

وفقًا لملف المحكمة، كانت مجموعة بيانات Books3 متاحة بشكل منفصل على Hugging Face حتى أكتوبر 2023، عندما تمت إزالتها لأنها "لم تعد موجودة ولم يعد من الممكن الوصول إليها بسبب انتهاك حقوق الطبع والنشر المُبلغ عنه".

يريد المؤلفون أن تستمر القضية كدعوى جماعية، حيث يعملون هم أنفسهم كممثلين جماعيين، ويطالبون بمحاكمة أمام هيئة محلفين والحصول على تعويضات عن الانتهاكات المزعومة لحقوق الطبع والنشر الخاصة بهم.

في بيان أرسلت إلى السجلوقال متحدث باسم Nvidia: "نحن نحترم حقوق جميع منشئي المحتوى ونعتقد أننا أنشأنا NeMo مع الالتزام الكامل بقانون حقوق الطبع والنشر."

هذه ليست الحالة الأولى التي يتم فيها رفع دعوى قضائية ضد شركة ذكاء اصطناعي بسبب اتهامات بانتهاك حقوق الطبع والنشر فيما يتعلق بالبيانات المستخدمة لتدريب نماذج الذكاء الاصطناعي. في ديسمبر من العام الماضي، أطلقت صحيفة نيويورك تايمز حملة قضية ضد مايكروسوفت وOpenAI بسبب الادعاءات بأن الزوجين استخدما مقالاتهما دون إذن لإنشاء ChatGPT ونماذج مماثلة.

وربما أصبحت هذه الحالة أكثر إثارة للاهتمام بعد تأكيد شركة OpenAI في شهر يناير الماضي أنها ستكون كذلك "من المستحيل" بناء شبكات عصبية من الدرجة الأولى التي تلبي احتياجات اليوم دون استخدام أعمال الأشخاص المحمية بحقوق الطبع والنشر.

وفي الوقت نفسه، لا تزال Nvidia تقوم بتجهيز مضخة الذكاء الاصطناعي بالإعلان عن شهادة احترافية جديدة في الذكاء الاصطناعي التوليدي لمساعدة المطورين على ترسيخ المصداقية التقنية في هذا المجال.

من المقرر أن يصبح متاحًا ليتزامن مع حدث GTC العملاق ومقره سانتا كلارا في وقت لاحق من هذا الشهر برنامج الشهادات المهنية ستقدم اعتمادين للذكاء الاصطناعي على مستوى المنتسبين، مع التركيز على الكفاءة في نماذج اللغة الكبيرة ومهارات سير العمل متعدد الوسائط. ®

الطابع الزمني:

اكثر من السجل