انجمن نویسندگان از OpenAI به دلیل استفاده از کتاب برای آموزش ChatGPT شکایت کرد

انجمن نویسندگان از OpenAI به دلیل استفاده از کتاب برای آموزش ChatGPT شکایت کرد

انجمن نویسندگان از OpenAI به دلیل استفاده از کتاب‌ها برای آموزش داده‌های ChatGPT PlatoBlockchain شکایت کرد. جستجوی عمودی Ai.

انجمن نویسندگان، یک انجمن تجاری برای نویسندگان منتشر شده، و 17 نویسنده، اژدهایان را در OpenAI به دلیل استفاده ادعایی آن از آثارشان برای آموزش ربات‌های چت خود منتشر کرده‌اند.

شاکیان نامبرده در دعوای دسته جمعی نقض حق چاپ - که در منطقه جنوبی نیویورک برای حق چاپ ثبت شده است - شامل دیوید بالداچی، مری بلی، مایکل کانلی، سیلویا دی، جاناتان فرانزن، جان گریشام، الین هیلدربراند، کریستینا بیکر کلاین، مایا شانباگ لانگ هستند. ویکتور لاوال، جرج آر آر مارتین، جودی پیکولت، داگلاس پرستون، رکسانا رابینسون، جورج ساندرز، اسکات تورو و ریچل ویل.

La شکایت [PDF] استدلال می‌کند که خدمات OpenAI «توانایی نویسندگان داستان‌های داستانی برای امرار معاش را به خطر می‌اندازد، زیرا مدل‌های زبانی بزرگ به هر کسی اجازه می‌دهد تا – به طور خودکار و آزادانه (یا بسیار ارزان) – متن‌هایی را تولید کند که در غیر این صورت برای خلق آنها به نویسندگان پول پرداخت می‌کردند.»

نویسندگان از اینکه نه تنها OpenAI مدل‌های خود را بدون اجازه آموزش می‌دادند، بلکه از اینکه سیستم‌های هوش مصنوعی هنگام پاسخ به درخواست‌های مردم به‌طور غیرمنصفانه از نوشته‌های آنها کپی می‌کردند، ناراضی هستند، یا چنین ادعا می‌شود.

شکایت اشاره می کند که ChatGPT با موفقیت از ایجاد یک طرح کلی برای یک کتاب پیش درآمد خواسته شده است. بازی تاج و تخت … با استفاده از همان شخصیت‌های کتاب‌های موجود مارتین در مجموعه ترانه ای از یخ و آتش" نتایج مشابهی برای سایر نویسندگانی که به این کت و شلوار پیوسته اند ممکن بود.

توانایی ChatGPT برای انجام این کار مشکل ساز است، با توجه به اینکه نویسندگان گفتند که به OpenAI اجازه دسترسی به آثار آنها را نداده اند زیرا به نظر می رسد این کار را انجام داده است. نویسندگان بر این باورند که وقتی آزمایشگاه هوش مصنوعی کار آنها را در طول آموزش وارد مدل کرد، این به کپی غیرمجاز تبدیل شد و مدل‌های GPT مشتقات غیرقانونی آثار دارای حق چاپ را تولید می‌کنند.

در پرونده قضایی ادعا شده است: "در قلب این الگوریتم ها سرقت سیستماتیک در مقیاس انبوه قرار دارد."

در این شکایت آمده است که OpenAI اعتراف کرده است که از مجموعه داده‌هایی با نام‌های «Books1» و «Books2» برای آموزش مدل‌های زبان بزرگ خود استفاده کرده است، اما محتوای آنها را فاش نکرده است. شاکیان مشکوک هستند که کتاب های دزدان دریایی به داده های آموزشی OpenAI راه یافته اند.

"رشد در قدرت و پیچیدگی از GPT-3 به GPT-4 نشان‌دهنده رشد همبستگی در اندازه مجموعه داده‌های آموزشی است، و این استنباط را افزایش می‌دهد که یک یا چند منبع بسیار بزرگ از کتاب‌های الکترونیکی غیرقانونی مورد بحث در بالا باید برای استفاده استفاده شده باشد. Train' GPT-4، در شکایت استدلال می‌شود، و افزود: «هیچ راه دیگری وجود ندارد که OpenAI بتواند حجم کتاب‌های مورد نیاز برای «آموزش» یک LLM قدرتمند مانند GPT-4 را به دست آورد.

در واقع، شکایت یک راه دیگر را ذکر می کند: پرداخت برای محتوای استفاده شده برای آموزش ChatGPT. اما در این دعوی ادعا شده است که OpenAI هرگز به این کار فکر نکرده است، و به شهادت سم آلتمن، مدیر عامل اجرایی به کنگره اشاره می‌کند که به حق چاپ اعتقاد دارد و برای برخی از داده‌های آموزشی پول پرداخت کرده است.

مری راسنبرگر، مدیر عامل انجمن نویسندگان، گفت: «برای نویسندگان داستان، استفاده غیرمجاز OpenAI از آثار آنها سرقت هویت در مقیاس بزرگ است.

او قبل از ابراز تاسف افزود: «نویسندگان داستان از تخیلات خود دنیاهای کاملاً جدیدی می‌آفرینند - آنها مکان‌ها، افراد و رویدادهای داستان‌های خود را خلق می‌کنند. شخصیت ها و داستان ها شرکت‌ها اعلان‌هایی را می‌فروشند که به شما امکان می‌دهد «وارد دنیای» کتاب‌های یک نویسنده شوید. اینها نقض آشکار حقوق مالکیت معنوی پدیدآورندگان اصلی است.»

شاکیان خواهان خسارت برای فرصت از دست رفته برای صدور مجوز آثار خود هستند، و برای غصب بازاری که متهمان [OpenAI] با شریک شدن شاکیان ناخواسته در جایگزینی خود، امکان پذیر کرده اند. و دستور دائمی برای جلوگیری از تکرار این آسیب ها.»

ثبت نام از OpenAI نظر خواسته است و اگر پاسخ قابل توجهی دریافت کنیم، این داستان را به روز خواهد کرد. ®

تمبر زمان:

بیشتر از ثبت نام