لماذا سيكون من الصعب الدفاع عن دعوى حقوق الطبع والنشر التي رفعتها صحيفة نيويورك تايمز؟

لماذا سيكون من الصعب الدفاع عن دعوى حقوق الطبع والنشر التي رفعتها صحيفة نيويورك تايمز؟

لماذا ستكون دعوى حقوق النشر الخاصة بالذكاء الاصطناعي التي رفعتها صحيفة نيويورك تايمز صعبة للدفاع عن ذكاء بيانات PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

نيويورك تايمز (نيويورك تايمز) الإجراءات القانونية فتحت شركة OpenAI وشركة Microsoft جبهة جديدة في التحديات القانونية المستمرة الناجمة عن استخدام البيانات المحمية بحقوق الطبع والنشر "لتدريب" الذكاء الاصطناعي التوليدي أو تحسينه.

هناك بالفعل مجموعة متنوعة من الدعاوى القضائية ضد شركات الذكاء الاصطناعي، بما في ذلك الدعوى المرفوعة من قبل صور غيتي ضد الاستقرار منظمة العفو الدولية، مما يجعل منشئ Stable Diffusion لتحويل النص إلى صورة عبر الإنترنت. قام المؤلفان جورج آر آر مارتن وجون غريشام أيضًا برفع قضايا قانونية ضد شركة OpenAI المالكة لـ ChatGPT بشأن مطالبات حقوق الطبع والنشر. لكن قضية نيويورك تايمز ليست "أكثر من نفس الشيء" لأنها تطرح حججًا جديدة مثيرة للاهتمام في هذا المزيج.

تركز الإجراءات القانونية على قيمة بيانات التدريب وسؤال جديد يتعلق بالضرر بالسمعة. إنه مزيج قوي من العلامات التجارية وحقوق النشر وقد يختبر دفاعات الاستخدام العادل التي يتم الاعتماد عليها عادةً.

ومما لا شك فيه أنه سيتم مراقبته عن كثب من قبل المؤسسات الإعلامية التي تتطلع إلى تحدي النهج المعتاد المتمثل في "دعونا نطلب الصفح، وليس الإذن" في التعامل مع بيانات التدريب. تُستخدم بيانات التدريب لتحسين أداء أنظمة الذكاء الاصطناعي وتتكون عمومًا من معلومات واقعية، غالبًا ما يتم استخلاصها من الإنترنت.

تقدم الدعوى أيضًا حجة جديدة - لم تقدمها قضايا أخرى مماثلة - تتعلق بشيء يسمى "الهلوسة" حيث تقوم أنظمة الذكاء الاصطناعي بتوليد معلومات خاطئة أو مضللة ولكنها تقدمها على أنها حقيقة. يمكن أن تكون هذه الحجة في الواقع واحدة من أقوى الحجة في هذه القضية.

وتثير قضية صحيفة نيويورك تايمز على وجه الخصوص ثلاث وجهات نظر مثيرة للاهتمام حول النهج المعتاد. أولاً، نظرًا لسمعتها في تقديم الأخبار والمعلومات الجديرة بالثقة، فقد عزز محتوى صحيفة نيويورك تايمز من القيمة والرغبة كبيانات تدريب للاستخدام في الذكاء الاصطناعي.

ثانيًا، نظرًا لنظام حظر الاشتراك غير المدفوع الذي تفرضه صحيفة نيويورك تايمز، فإن إعادة إنتاج المقالات عند الطلب يعد ضارًا تجاريًا. ثالثا، ذلك شات جي بي تي تتسبب الهلوسة في الإضرار بسمعة صحيفة نيويورك تايمز من خلال الإسناد الكاذب بشكل فعال.

هذا ليس مجرد نزاع آخر حول حقوق الطبع والنشر للذكاء الاصطناعي. الحجة الأولى التي قدمتها صحيفة نيويورك تايمز هي أن بيانات التدريب التي تستخدمها OpenAI محمية بموجب حقوق الطبع والنشر، ولذلك يزعمون أن مرحلة التدريب في ChatGPT تنتهك حقوق الطبع والنشر. لقد رأينا هذا النوع من الحجة تشغيل من قبل في نزاعات أخرى.

استخدام عادل؟

التحدي الذي يواجه هذا النوع من الهجوم هو درع الاستخدام العادل. في الولايات المتحدة، الاستخدام العادل هو مبدأ قانوني يسمح باستخدام المواد المحمية بحقوق الطبع والنشر في ظروف معينة، مثل التقارير الإخبارية والعمل الأكاديمي والتعليقات.

استجابة OpenAI لقد كان الأمر حذرًا للغاية حتى الآن، ولكن المبدأ الرئيسي في البيان الصادر عن الشركة هو أن استخدامها للبيانات عبر الإنترنت يندرج بالفعل تحت مبدأ "الاستخدام العادل".

وتوقعًا لبعض الصعوبات التي قد يسببها مثل هذا الدفاع عن الاستخدام العادل، تبنت صحيفة نيويورك تايمز زاوية مختلفة قليلاً. وعلى وجه الخصوص، تسعى إلى تمييز بياناتها عن البيانات القياسية. تعتزم صحيفة نيويورك تايمز استخدام ما تدعي أنه الدقة والجدارة بالثقة والمكانة في تقاريرها. وتدعي أن هذا يخلق مجموعة بيانات مرغوبة بشكل خاص.

وتجادل بأن مقالاتها، باعتبارها مصدرًا موثوقًا وحسن السمعة، تتمتع بوزن إضافي وموثوقية في تدريب الذكاء الاصطناعي التوليدي، وهي جزء من مجموعة فرعية من البيانات يتم منحها وزنًا إضافيًا في هذا التدريب.

وتجادل بأنه من خلال إعادة إنتاج المقالات إلى حد كبير عند المطالبة، فإن ChatGPT قادر على رفض نيويورك تايمز، وهو محمي بنظام حظر الاشتراك غير المدفوعوالزوار والإيرادات التي قد تتلقاها بخلاف ذلك. يبدو أن هذا الإدخال لبعض جوانب المنافسة التجارية والميزة التجارية يهدف إلى تجنب دفاع الاستخدام العادل المعتاد المشترك بين هذه المطالبات.

سيكون من المثير للاهتمام معرفة ما إذا كان التأكيد على الترجيح الخاص في بيانات التدريب له تأثير. إذا حدث ذلك، فإنه يمهد الطريق للمؤسسات الإعلامية الأخرى للاعتراض على استخدام تقاريرها في بيانات التدريب دون إذن.

يقدم العنصر الأخير من مطالبة صحيفة نيويورك تايمز زاوية جديدة لهذا التحدي. ويشير هذا إلى أن الضرر قد لحق بالعلامة التجارية لصحيفة نيويورك تايمز من خلال المواد التي تنتجها ChatGPT. على الرغم من أنه تم تقديمه كفكرة لاحقة في الشكوى، إلا أنه قد يكون الادعاء هو الذي يسبب الصعوبة الأكبر لـ OpenAI.

هذه هي الحجة المتعلقة بهلوسة الذكاء الاصطناعي. تقول صحيفة نيويورك تايمز أن هذا الأمر معقد لأن ChatGPT يقدم المعلومات على أنها جاءت من نيويورك تايمز.

وتشير الصحيفة أيضًا إلى أن المستهلكين قد يتصرفون بناءً على الملخص الذي قدمه ChatGPT، معتقدين أن المعلومات تأتي من نيويورك تايمز ويجب الوثوق بها. يحدث الضرر بالسمعة لأن الصحيفة ليس لديها سيطرة على ما تنتجه ChatGPT.

وهذا تحدٍ مثير للاهتمام يجب اختتامه. تعتبر الهلوسة مشكلة معترف بها في الاستجابات التي يولدها الذكاء الاصطناعي، وتقول صحيفة نيويورك تايمز إن الضرر الذي لحق بالسمعة قد لا يكون من السهل تصحيحه.

تفتح مطالبة صحيفة نيويورك تايمز عددًا من خطوط الهجوم الجديدة التي تنقل التركيز من حقوق الطبع والنشر إلى كيفية تقديم البيانات المحمية بحقوق الطبع والنشر للمستخدمين بواسطة ChatGPT وقيمة تلك البيانات للصحيفة. وهذا أمر أكثر صعوبة بالنسبة لـ OpenAI للدفاع عنه.

ستتم مراقبة هذه القضية عن كثب من قبل ناشري وسائل الإعلام الآخرين، وخاصة أولئك الذين يقفون وراء نظام حظر الاشتراك غير المدفوع، مع إيلاء اهتمام خاص لكيفية تفاعلها مع دفاع الاستخدام العادل المعتاد.

إذا تم الاعتراف بمجموعة بيانات نيويورك تايمز بأنها تتمتع "بالقيمة المعززة" التي تدعي أنها تمتلكها، فقد يمهد ذلك الطريق لتحقيق الدخل من مجموعة البيانات تلك في تدريب الذكاء الاصطناعي بدلا من نهج "التسامح، وليس الإذن" السائد اليوم.

يتم إعادة نشر هذه المقالة من المحادثة تحت رخصة المشاع الإبداعي. إقرأ ال المقال الأصلي.

الصورة الائتمان: الرؤية المطلقة / Unsplash 

الطابع الزمني:

اكثر من التفرد المحور