برنده جایزه پولیتزر و دیگران از OpenAI شکایت کردند

برنده جایزه پولیتزر و دیگران از OpenAI شکایت کردند

مایکل چابون، رمان‌نویس آمریکایی برنده جایزه پولیتزر و چندین نویسنده دیگر یک طرح دعوای دسته جمعی ارائه کرده‌اند که OpenAI را به نقض حق نسخه‌برداری متهم کرده‌اند که گفته می‌شود آثار خود را به مجموعه داده‌های مورد استفاده برای آموزش مدل‌های پشت ChatGPT کشیده‌اند.

دعوا ادعا می کند که OpenAI «شبکه گسترده ای را در سراسر اینترنت پرتاب کرده است» تا جامع ترین مجموعه محتوای موجود را برای آموزش بهتر مدل های GPT خود به تصویر بکشد، و ظاهراً «ضرورا» آن را به «گرفتن، دانلود، و آثار مکتوب، نمایشنامه ها و دارای حق نسخه برداری سوق می دهد». مقالات.”

یکی از جالب‌ترین بخش‌های این دادخواست ادعایی درباره این است که چگونه نویسندگان بر این باورند که تجارت هوش مصنوعی به «دو مجموعه کتاب مبتنی بر اینترنت» دست یافته است، که اشاره می‌کند که OpenAI صرفاً به‌عنوان «Books1» و «Books2» از آن یاد می‌کند. این پرونده ادعا می کند که در مقاله ژوئیه 2020 که GPT-3 را معرفی می کند، "مدل های زبانی یادگیرندگان کمی هستند"، OpenAI فاش کرد که علاوه بر مجموعه داده های صفحه وب "Common Crawl" و "WebText"، "16 درصد از مجموعه داده های آموزشی GPT3" از… "Books1" و "Books2" آمده است."

شکایت نویسندگان در ادامه ادعا می‌کند که تنها چند مکان در اینترنت عمومی وجود دارد که حاوی این مقدار مطالب است، و ادعا می‌کند که مجموعه داده‌های OpenAI Books1 «بر اساس استاندارد پروژه گوتنبرگ یا خود پروژه گوتنبرگ است» و هوش مصنوعی را متهم می‌کند. منبع کتاب 2 از:

وب‌سایت‌های بدنام «کتابخانه سایه»، مانند Library Genesis («LibGen»)، Z-Library، Sci-Hub، و Bibliotik، که میزبان مجموعه‌های عظیمی از کتاب‌های غیرقانونی، مقالات تحقیقاتی و سایر مطالب مبتنی بر متن هستند. مطالب جمع آوری شده توسط این وب سایت ها نیز به صورت انبوه از طریق سیستم های تورنت در دسترس بوده است.

دیوید هنری هوانگ، برنده جایزه تونی و گرمی، نمایشنامه نویس و فیلمنامه نویس نیز در این لباس گنجانده شده است. م. پروانه, چینگلیش, صورت زردو رقص و راه آهن; برنده پی بادی و عشق و دیگر کارهای غیرممکن نویسنده آیلت والدمن; زنانی که دفن کردیم نویسنده ریچل لوئیز اسنایدر; و ثروتمند کیست؟ کاتب متیو کلام.

نویسندگان ادعا می‌کنند که چون «وقتی از ChatGPT خواسته می‌شود، نه تنها خلاصه، بلکه تحلیل‌های عمیقی از مضامین موجود در آثار دارای حق نسخه‌برداری شاکیان ایجاد می‌کند»، نویسندگان معتقدند «مدل GPT زیربنایی با استفاده از آثار [شاکیان] آموزش داده شده است. "

وکلای نویسندگان نیز ادعا می کنند که وقتی از آنها خواسته می شود پاراگراف را به سبک ماجراهای شگفت انگیز Kavalier & ClayChatGPT، کتابی که چابون رمان‌نویس آمریکایی پولیتزر خود را به ارمغان آورد، متنی با تقلید از سبک نوشتاری او و شامل ارجاعاتی به شخصیت‌هایی که با «سنگینی جهان در جنگ» سروکار دارند، ایجاد کرد.

تصویری از شکایت، نمایشگاه A

اسکرین شات از شکایت، نمایش A (برای بزرگنمایی کلیک کنید)

La دادخواست [PDF] در اواخر هفته گذشته در دادگاه فدرال کالیفرنیا بایگانی شد و دیروز به قاضی سانفرانسیسکو، پیتر اچ. کانگ، منصوب شد.

OpenAI با شکایت های متعددی در مورد کپی رایت روبرو است - از جمله دو پرونده در سانفرانسیسکو که توسط رمان نویسان پل ترمبلی و مونا آواد، و به طور جداگانه، کمدین سارا سیلورمن و رمان نویسان کریستوفر گلدن و ریچارد کادری ثبت شده است. وکلای آن در آن موارد استدلال کردند که هوش مصنوعی قوانین کپی رایت را نقض نکرده است، و ادعا کردند که LLM های ChatGPT تحت دکترین ایالات متحده "استفاده منصفانه" محافظت می شوند. استدلال آنها این است که روشی که تجارت از متن استفاده می کند با ایالات متحده مطابقت دارد قانون کپی رایت، که یک استثنای استفاده منصفانه را برای به اصطلاح "استفاده های متحول کننده" از کار اجازه می دهد - ریمیکسی از اثر اصلی که به هدف یا مخاطب دیگری خدمت می کند.

اداره کپی رایت ایالات متحده است در حال حاضر به دنبال نظر در مورد مطالعه قانون کپی رایت و مسائل خط مشی مطرح شده توسط سیستم های هوش مصنوعی.

دفاع برای OpenAI هنوز پاسخی به شکایت Chabon ارائه نکرده است. ما از OpenAI نظر خواسته ایم.

اتهامات موجود در این پرونده شامل نقض مستقیم و نایب حق چاپ، حذف غیرقانونی اطلاعات مدیریت حق چاپ، رقابت ناعادلانه، و غنی سازی ناعادلانه است. آنها به دنبال صدور حکمی علیه نقض حق چاپ خود و همچنین خسارات نامشخص هستند.

سام آلتمن، رئیس OpenAI، هفته گذشته اولین گل اندونزی را به ثمر رساند ویزای طلایی - به این معنی که او اکنون می تواند تا 10 سال در کشور مجمع الجزایر زندگی کند - با توجه به پتانسیل خود برای "ایجاد سرمایه گذاری ورودی". ®

تمبر زمان:

بیشتر از ثبت نام