عمالقة التكنولوجيا يتهربون من الأسئلة حول قواعد حقوق الطبع والنشر لماجستير الحقوق

عمالقة التكنولوجيا يتهربون من الأسئلة حول قواعد حقوق الطبع والنشر لماجستير الحقوق

عمالقة التكنولوجيا يتهربون من الأسئلة حول قواعد حقوق النشر في LLM PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

في برلمان المملكة المتحدة هذا الأسبوع، تجنبت شركتا مايكروسوفت وميتا مسألة ما إذا كان ينبغي للمبدعين أن يحصلوا على أموال عندما يتم استخدام المواد المحمية بحقوق الطبع والنشر الخاصة بهم لتدريب نماذج لغوية كبيرة.

وكان عمالقة التكنولوجيا، الذين تجاوزت إيراداتهم مجتمعة 200 مليار دولار، موجودين مشوي من قبل لجنة الاتصالات والرقمية بمجلس اللوردات عندما تم التركيز على مسألة حقوق الطبع والنشر.

وفي سبتمبر/أيلول، اجتمعت نقابة المؤلفين، وهي رابطة تجارية للكتاب المنشورين، و17 مؤلفاً رفعت دعوى جماعية في الولايات المتحدة بشأن استخدام OpenAI لموادها لإنشاء خدماتها المستندة إلى LLM.

قال سام ألتمان، الرئيس التنفيذي لشركة OpenAI، منذ ذلك الحين إن الشركة ستغطي التكاليف القانونية لعملائها بسبب دعاوى انتهاك حقوق الطبع والنشر بدلاً من إزالة المواد من مجموعات التدريب الخاصة بها.

لدى ميكروسوفت استثمرت 13 مليار دولار في OpenAI. لديها شراكة موسعة مع مطور التعلم الآلي، حيث تعمل على تشغيل أعباء العمل الخاصة بها على النظام الأساسي السحابي Azure واستخدام نماذجها لتشغيل المساعد الآلي Copilot.

وفي حديثه أمام اللوردات أمس، قال أوين لارتر، مدير السياسة العامة في مكتب مايكروسوفت للذكاء الاصطناعي المسؤول: "من المهم أن نقدر ماهية النموذج اللغوي الكبير. إنه نموذج كبير تم تدريبه على البيانات النصية، وتعلم الارتباط بين الأفكار المختلفة. ليس بالضرورة أن يمتص أي شيء من الأسفل."

وقال إنه يجب أن يكون هناك "إطار عمل" لتوفير بعض الحماية للمواد المحمية بحقوق الطبع والنشر، وستتحمل شركة Microsoft المسؤولية عن أي انتهاك من جانب أنظمتها المستندة إلى LLM. لكنه قال أيضا أن مايكروسوفت تدعم الأخيرة تقرير فالانس في قانون الذكاء الاصطناعي "المؤيد للابتكار" في المملكة المتحدة والذي يدعو إلى استثناءات النصوص والبيانات في نماذج التدريب.

لكن دونالد مايكل، اللورد فوستر أوف باث، ضغط على لارتر بشأن ما إذا كان سيقبل أنه إذا استخدمت شركة ما مواد محمية بحقوق الطبع والنشر لبناء شهادة ماجستير في الحقوق من أجل الربح، فيجب تعويض مالك حقوق الطبع والنشر.

قال مدير مايكروسوفت: "من المهم حقًا أن تفهم أنك بحاجة إلى تدريب نماذج اللغات الكبيرة هذه على مجموعات كبيرة من البيانات إذا كنت تريد جعلها تعمل بفعالية، وإذا كنت ستسمح لها بأن تكون آمنة ومأمونة... هناك أيضًا بعض مشكلات المنافسة [في التأكد] من أن تدريب النماذج الكبيرة متاح للجميع. إذا ذهبت بعيدًا في مسار يصعب فيه جدًا الحصول على البيانات اللازمة لتدريب النماذج، فعندئذ فجأة، ستصبح القدرة على القيام بذلك حكرًا على الشركات الكبيرة جدًا.

التقاضي جاري بالفعل لمعالجة كيفية مجموعات بيانات التدريب الكتب 1تم استخدام Books2 وBooks3، والتي تعمل بشكل فعال على قرصنة المواد المحمية بحقوق الطبع والنشر، للمساعدة في بناء شهادات LLM مشهورة.

ميتا وراء اللاما 2 ماجستير، والذي يصل إلى 70 مليار معلمة. وقد روج عملاق وسائل التواصل الاجتماعي للنموذج باعتباره مفتوح المصدر، على الرغم من أن أنصار البرمجيات الحرة والمفتوحة المصدر يشيرون إلى بعض المحاذير في نهجه.

وفي حديثه إلى اللوردات، قال روب شيرمان، نائب الرئيس ونائب كبير مسؤولي الخصوصية لسياسة الخصوصية في شركة ميتا، إن الشركة ستلتزم بالقانون.

لكنه أضاف أن "الحفاظ على إمكانية الوصول على نطاق واسع إلى المعلومات على الإنترنت والمعلومات بما في ذلك استخدامها في ابتكار مثل هذا أمر مهم للغاية. أنا أؤيد منح أصحاب الحقوق القدرة على إدارة كيفية استخدام معلوماتهم.

"أنا حذر بعض الشيء بشأن فكرة إجبار الشركات التي تقوم ببناء الذكاء الاصطناعي على الدخول في اتفاقيات مخصصة مع أصحاب الحقوق الأفراد أو أمر بالدفع مقابل محتوى ليس له قيمة اقتصادية بالنسبة لهم".

في الأسبوع الماضي، أخبر دان كونواي، الرئيس التنفيذي لاتحاد الناشرين في المملكة المتحدة، اللجنة أن النماذج اللغوية الكبيرة تنتهك المحتوى المحمي بحقوق الطبع والنشر على "نطاق هائل للغاية".

وقال: "نحن نعرف هذا في صناعة النشر بسبب قاعدة بيانات Books3 التي تضم 120,000 ألف عنوان كتاب مقرصنة، والتي نعلم أنه تم استيعابها من قبل نماذج لغوية كبيرة". "نحن نعلم أن المحتوى يتم استيعابه على نطاق واسع للغاية بواسطة نماذج لغوية كبيرة. تنتهك LLMs حقوق الطبع والنشر في أجزاء متعددة من العملية من حيث وقت جمع هذه المعلومات وكيفية تخزين هذه المعلومات وكيفية التعامل معها. يتم انتهاك قانون حقوق الطبع والنشر على نطاق واسع.

وفي الجلسة نفسها، قالت الدكتورة هايلي بوشر، القارئة في قانون الملكية الفكرية بجامعة برونيل بلندن، إنها لا تمثل شركات التكنولوجيا أو منشئي المحتوى وعرضت وجهة نظر محايدة.

وقالت: "إن مبدأ متى تحتاج إلى ترخيص ومتى لا تحتاج إليه هو مبدأ واضح، وإعادة إنتاج عمل محمي بحقوق الطبع والنشر دون الحصول على إذن يتطلب ترخيصًا أو قد يشكل انتهاكًا. هذا ما يفعله الذكاء الاصطناعي في خطوات مختلفة من العملية: الاستيعاب، وتشغيل البرنامج، وربما حتى الإخراج.

"يجادل بعض مطوري الذكاء الاصطناعي والتكنولوجيا حول تفسير مختلف للقانون. وأنا لا أمثل أياً من هذين الجانبين. أنا خبير في حقوق الطبع والنشر، ومن موقعي، وفهم ما يفترض أن تحققه حقوق الطبع والنشر وكيف تحققه، فإنك تحتاج إلى ترخيص لهذا النشاط. ®

الطابع الزمني:

اكثر من السجل