الفائز بجائزة بوليتزر وآخرون يرفعون دعوى قضائية ضد OpenAI

الفائز بجائزة بوليتزر وآخرون يرفعون دعوى قضائية ضد OpenAI

قدم الروائي الأمريكي الحائز على جائزة بوليتزر مايكل شابون والعديد من الكتاب الآخرين دعوى جماعية مقترحة تتهم شركة OpenAI بانتهاك حقوق الطبع والنشر بزعم سحب أعمالهم إلى مجموعات البيانات المستخدمة لتدريب النماذج وراء ChatGPT.

تدعي الدعوى أن OpenAI "أطلقت شبكة واسعة عبر الإنترنت" لالتقاط المجموعة الأكثر شمولاً من المحتوى المتاح لتدريب نماذج GPT الخاصة بها بشكل أفضل، ويُزعم أن ذلك يقودها "بالضرورة" إلى "التقاط وتنزيل ونسخ الأعمال المكتوبة والمسرحيات والأفلام المحمية بحقوق الطبع والنشر". مقالات."

أحد الأجزاء الأكثر إثارة للاهتمام في الدعوى القضائية هو الادعاء حول كيف يعتقد المؤلفون أن شركة الذكاء الاصطناعي وضعت يديها على "مجموعتين من الكتب على الإنترنت"، والتي تشير إليها OpenAI ببساطة باسم "Books1" و"Books2". يزعم الملف أنه في ورقة يوليو 2020 التي قدمت GPT-3، "نماذج اللغة هي عدد قليل من المتعلمين"، كشفت OpenAI أنه بالإضافة إلى مجموعات بيانات صفحة الويب "Common Crawl" و"WebText"، فإن "16 بالمائة من مجموعة بيانات تدريب GPT3 جاء من... "الكتب 1" و"الكتب 2".

وتستمر الدعوى القضائية للكتاب في الادعاء بأنه لا يوجد سوى عدد قليل من الأماكن على الإنترنت العام التي تحتوي على هذا القدر من المواد، زاعمين أن مجموعة بيانات OpenAI’s Books1 "تعتمد إما على مشروع موحد من مجموعة جوتنبرج أو مشروع جوتنبرج نفسه" واتهام عالم الذكاء الاصطناعي بـ مصادر الكتب 2:

مواقع "مكتبة الظل" سيئة السمعة، مثل Library Genesis ("LibGen") وZ-Library وSci-Hub وBibliotik، والتي تستضيف مجموعات ضخمة من الكتب المقرصنة والأوراق البحثية وغيرها من المواد النصية. المواد المجمعة بواسطة هذه المواقع متاحة أيضًا بكميات كبيرة من خلال أنظمة التورنت.

ومن بين البدلة أيضًا ديفيد هنري هوانج الحائز على جائزة توني وجرامي، وهو الكاتب المسرحي وكاتب السيناريو م فراشة, Chinglish, يلو فيسو الرقص والسكك الحديدية; الفائز بيبودي و الحب والمساعي المستحيلة الأخرى المؤلف اييليت والدمان. نساء دفنا المؤلف راشيل لويز سنايدر؛ و من هو ريتش؟ الكاتب ماثيو كلام.

يزعم الكتاب أنه "عندما يُطلب من ChatGPT، فإنه لا ينتج ملخصات فحسب، بل تحليلات متعمقة للموضوعات الموجودة في أعمال المدعين المحمية بحقوق الطبع والنشر،" ويعتقد الكتاب أن "نموذج GPT الأساسي تم تدريبه باستخدام أعمال المدعين". ".

يدعي محامو الكتاب أيضًا أنه عندما طُلب منهم كتابة فقرة بأسلوب مغامرات كافالييه وكلاي المذهلة، الكتاب الذي حصل فيه الروائي الأمريكي شابون على جائزة بوليتزر، أنتج ChatGPT مقطعًا يقلد أسلوب كتابته ويتضمن إشارات إلى الشخصيات التي تتعامل مع "ثقل العالم في حالة حرب".

لقطة شاشة من الشكوى، المعرض أ

لقطة شاشة من الشكوى، الشكل أ (اضغط للتكبير)

بدلة [PDF] تم تقديمه إلى المحكمة الفيدرالية في كاليفورنيا في أواخر الأسبوع الماضي وتم تعيينه بالأمس للقاضي الجزئي في سان فرانسيسكو بيتر إتش كانغ.

تواجه شركة OpenAI العديد من الدعاوى القضائية حول حقوق الطبع والنشر ــ بما في ذلك قضيتين في سان فرانسيسكو رفعهما الروائيان بول تريمبلاي ومنى عوض، وبشكل منفصل، الممثلة الكوميدية سارة سيلفرمان والروائيان كريستوفر جولدن وريتشارد كادري. وجادل محاموها في تلك القضايا بأن شركة الذكاء الاصطناعي لم تنتهك قوانين حقوق الطبع والنشر، زاعمين أن شهادات LLM الخاصة بشركة ChatGPT محمية بموجب مبدأ "الاستخدام العادل" الأمريكي. حجتهم هي أن الطريقة التي تستخدم بها الشركة النص تتوافق مع الولايات المتحدة قانون حقوق الطبع، والذي يسمح باستثناء الاستخدام العادل لما يسمى "الاستخدامات التحويلية" للعمل - وهو عبارة عن ريمكس للعمل الأصلي يخدم غرضًا أو جمهورًا مختلفًا.

مكتب حقوق الطبع والنشر في الولايات المتحدة هو حاليا طلب التعليق على دراسة قانون حق المؤلف وقضايا السياسة التي تثيرها أنظمة الذكاء الاصطناعي.

لم يقدم الدفاع عن OpenAI بعد ردًا على شكوى شابون. لقد طلبنا من OpenAI التعليق.

تشمل الادعاءات في هذه القضية انتهاكًا مباشرًا وغير مباشر لحقوق الطبع والنشر، والإزالة غير القانونية لمعلومات إدارة حقوق الطبع والنشر، والمنافسة غير العادلة، والإثراء غير العادل. إنهم يسعون للحصول على أمر قضائي ضد انتهاك حقوق الطبع والنشر الخاصة بهم بالإضافة إلى أضرار غير محددة.

سجل رئيس OpenAI سام ألتمان الأسبوع الماضي أول هدف في إندونيسيا على الإطلاق تأشيرة ذهبية - مما يعني أنه يستطيع الآن العيش في الدولة الأرخبيلية لمدة تصل إلى 10 سنوات - تقديراً لقدرته على "توليد الاستثمار الداخلي". ®

الطابع الزمني:

اكثر من السجل