چرا دفاع از دعوای حق نشر هوش مصنوعی نیویورک تایمز دشوار خواهد بود؟

چرا دفاع از دعوای حق نشر هوش مصنوعی نیویورک تایمز دشوار خواهد بود؟

چرا دعوای حق نشر هوش مصنوعی نیویورک تایمز برای دفاع از هوش داده پلاتوبلاکچین دشوار خواهد بود؟ جستجوی عمودی Ai.

نیویورک تایمز (NYT) روند قانونی در مقابل OpenAI و مایکروسافت مرز جدیدی را در چالش‌های حقوقی مداومی که با استفاده از داده‌های دارای حق چاپ برای «آموزش» یا بهبود هوش مصنوعی ایجاد می‌شود، باز کرده است.

در حال حاضر شکایت های مختلفی علیه شرکت های هوش مصنوعی وجود دارد، از جمله یکی از آنها Getty Images در برابر Stability AI، که باعث می شود Stable Diffusion تولید کننده متن به تصویر آنلاین باشد. نویسندگان جورج آر.آر.آر.آر.آر.آر.آر.آر.آر.آر.آر.آر.آر.آ.آر.مارتین و جان گریشام نیز علیه مالک ChatGPT، OpenAI، به دلیل ادعاهای مربوط به کپی رایت، پرونده های حقوقی را مطرح کرده اند. اما مورد NYT "بیشتر شبیه به هم" نیست، زیرا استدلال های جدید جالبی را در ترکیب قرار می دهد.

اقدام حقوقی بر روی تمرکز دارد ارزش داده های آموزشی و یک سوال جدید در رابطه با آسیب شهرت. این ترکیبی قوی از علائم تجاری و حق چاپ است و ممکن است دفاع منصفانه که معمولاً بر آن تکیه می شود را آزمایش کند.

بدون شک، سازمان‌های رسانه‌ای که به‌دنبال به چالش کشیدن رویکرد معمول "بیایید بخشش بخواهیم، ​​نه اجازه" برای داده‌های آموزشی، این موضوع را از نزدیک تماشا کنند. داده های آموزشی برای بهبود عملکرد سیستم های هوش مصنوعی استفاده می شود و به طور کلی شامل اطلاعات دنیای واقعی است که اغلب از اینترنت گرفته می شود.

دعوا همچنین استدلال جدیدی را ارائه می دهد - که توسط سایر موارد مشابه مطرح نشده است - که به چیزی به نام مربوط می شود. "توهمات" جایی که سیستم‌های هوش مصنوعی اطلاعات نادرست یا گمراه‌کننده تولید می‌کنند اما آن را به عنوان واقعیت ارائه می‌کنند. این استدلال در واقع می تواند یکی از قوی ترین استدلال ها در این مورد باشد.

مورد NYT به طور خاص سه برداشت جالب از رویکرد معمول را مطرح می کند. اول، اینکه محتوای NYT به دلیل شهرت خود برای اخبار و اطلاعات قابل اعتماد، ارزش و مطلوبیت را به عنوان داده های آموزشی برای استفاده در هوش مصنوعی افزایش داده است.

دوم، اینکه به دلیل دیوار پرداختی NYT، تکثیر مقالات در صورت درخواست از نظر تجاری مضر است. سوم اینکه GPT چت توهمات از طریق اسناد نادرست به طور مؤثر به نیویورک تایمز آسیب می زند.

این فقط یکی دیگر از اختلافات مولد حق نسخه برداری هوش مصنوعی نیست. اولین استدلال ارائه شده توسط NYT این است که داده های آموزشی مورد استفاده توسط OpenAI توسط کپی رایت محافظت می شود و بنابراین آنها ادعا می کنند که مرحله آموزشی ChatGPT حق چاپ را نقض کرده است. ما این نوع استدلال را دیده ایم قبل از اجرا در سایر اختلافات

استفاده منصفانه؟

چالش این نوع حمله است سپر استفاده منصفانه. در ایالات متحده، استفاده منصفانه یک دکترین قانونی است که استفاده از مطالب دارای حق چاپ را تحت شرایط خاصی مجاز می‌کند، مانند گزارش‌های خبری، کارهای دانشگاهی و تفسیر.

پاسخ OpenAI تا کنون بسیار محتاط بوده است، اما یک اصل کلیدی در بیانیه منتشر شده توسط این شرکت این است که استفاده آنها از داده های آنلاین در واقع تحت اصل "استفاده منصفانه" قرار می گیرد.

با پیش بینی برخی از مشکلاتی که چنین دفاع منصفانه ای می تواند به طور بالقوه ایجاد کند، NYT زاویه کمی متفاوت را اتخاذ کرده است. به ویژه، به دنبال تمایز داده های خود از داده های استاندارد است. NYT قصد دارد از آنچه که ادعا می کند دقت، قابل اعتماد بودن و اعتبار گزارش های خود است استفاده کند. ادعا می کند که این یک مجموعه داده به خصوص مطلوب ایجاد می کند.

استدلال می‌کند که به‌عنوان یک منبع معتبر و قابل اعتماد، مقالات آن وزن و اعتبار بیشتری در آموزش هوش مصنوعی مولد دارند و بخشی از زیرمجموعه داده‌ای هستند که وزن بیشتری در آن آموزش داده می‌شود.

این استدلال می کند که ChatGPT با بازتولید تا حد زیادی مقالات پس از درخواست، می تواند NYT را رد کند، که paywalled است، بازدیدکنندگان و درآمدی که در غیر این صورت دریافت می کرد. به نظر می رسد که این معرفی برخی از جنبه های رقابت تجاری و مزیت تجاری قصد دارد از دفاع معمول استفاده منصفانه رایج در این ادعاها جلوگیری کند.

جالب خواهد بود که ببینیم آیا ادعای وزن ویژه در داده های آموزشی تأثیر دارد یا خیر. اگر چنین کند، مسیری را برای سایر سازمان‌های رسانه‌ای تعیین می‌کند تا استفاده از گزارش‌های خود را در داده‌های آموزشی بدون مجوز به چالش بکشند.

عنصر نهایی ادعای نیویورک‌تایمز زاویه جدیدی از چالش را ارائه می‌دهد. این نشان می دهد که از طریق موادی که ChatGPT تولید می کند به برند NYT آسیب وارد شده است. اگرچه تقریباً به عنوان یک فکر بعدی در شکایت ارائه شده است، اما ممکن است این ادعا باشد که OpenAI را بیشترین مشکل را ایجاد کند.

این بحث مربوط به توهمات هوش مصنوعی است. NYT استدلال می‌کند که این امر ترکیبی است زیرا ChatGPT اطلاعات را به گونه‌ای ارائه می‌کند که از NYT آمده است.

این روزنامه همچنین پیشنهاد می کند که مصرف کنندگان ممکن است بر اساس خلاصه ارائه شده توسط ChatGPT عمل کنند، زیرا فکر می کنند اطلاعات از NYT می آید و قابل اعتماد است. آسیب شهرت به این دلیل است که روزنامه هیچ کنترلی بر آنچه ChatGPT تولید می کند ندارد.

این یک چالش جالب برای نتیجه گیری است. توهم یک مشکل شناخته شده در پاسخ های ایجاد شده توسط هوش مصنوعی است و NYT استدلال می کند که ممکن است آسیب به شهرت اصلاح نشود.

ادعای NYT چندین خط حمله جدید را باز می کند که تمرکز را از حق نسخه برداری به نحوه ارائه داده های دارای حق چاپ به کاربران توسط ChatGPT و ارزش آن داده ها برای روزنامه منتقل می کند. این برای OpenAI برای دفاع بسیار پیچیده تر است.

این مورد توسط ناشران دیگر رسانه‌ها، به ویژه ناشران در پشت دیوارهای پرداخت، و با توجه به نحوه تعامل آن با دفاع معمول برای استفاده منصفانه به دقت مشاهده خواهد شد.

اگر مجموعه داده NYT به عنوان دارای "ارزش پیشرفته" مورد ادعا شناخته شود، ممکن است راه را برای کسب درآمد از این مجموعه داده در آموزش هوش مصنوعی به جای رویکرد "بخشش، نه مجوز" رایج امروزی هموار کند.

این مقاله از مجله منتشر شده است گفتگو تحت مجوز Creative Commons دفعات بازدید: مقاله.

تصویر های اعتباری: AbsolutVision / می Unsplash 

تمبر زمان:

بیشتر از تکینگی هاب