Лауреат Пулітцерівської премії та інші подали до суду на OpenAI

Лауреат Пулітцерівської премії та інші подали до суду на OpenAI

Американський прозаїк, лауреат Пулітцерівської премії Майкл Чейбон і кілька інших письменників подали запропонований груповий позов, звинувачуючи OpenAI у порушенні авторських прав за те, що вони нібито втягнули їхні роботи в набори даних, які використовуються для навчання моделей ChatGPT.

У позові стверджується, що OpenAI «розгорнув широку мережу через Інтернет», щоб отримати найповніший набір доступного вмісту для кращого навчання своїх моделей GPT, нібито «обов’язково» змушуючи його «захоплювати, завантажувати та копіювати захищені авторським правом письмові твори, п’єси та статті».

Однією з найцікавіших частин позову є твердження про те, як, на думку авторів, AI-бізнес отримав у свої руки «два книжкові корпуси в Інтернеті», які, як зазначається, OpenAI просто називає «Books1» і «Books2». У документі стверджується, що в документі від липня 2020 року, який представляє GPT-3, «Мовні моделі мало хто вивчає», OpenAI розкрив, що окрім наборів даних веб-сторінок «Common Crawl» і «WebText», «16 відсотків набору навчальних даних GPT3 походить із… «Книг1» і «Книг2».

У позові автори стверджують, що в загальнодоступному Інтернеті є лише кілька місць, які містять стільки матеріалів, стверджуючи, що набір даних OpenAI Books1 «базується або на стандартизованому корпусі проекту Гутенберга, або на самому проекті Гутенберга», і звинувачує бізнес штучного інтелекту в джерело Books2 з:

сумнозвісні веб-сайти «тіньових бібліотек», такі як Library Genesis («LibGen»), Z-Library, Sci-Hub і Bibliotik, які містять величезні колекції піратських книг, наукових статей та інших текстових матеріалів. Матеріали, зібрані цими веб-сайтами, також були доступні масово через торрент-системи.

Також у костюм включений лауреат премій Тоні та Греммі Девід Генрі Хван, драматург і сценарист М. Метелик, Чінгліш, Жовте обличчя та Танець і залізниця; Переможець Пібоді і Любов та інші неможливі пошуки автор Аєлет Уолдман; Жінки, яких ми поховали автор Рейчел Луїза Снайдер; і Хто такий багатий? писар Метью Клам.

Автори стверджують, що оскільки «коли запитується ChatGPT, він генерує не лише підсумки, але й глибокий аналіз тем, присутніх у захищених авторським правом роботах позивачів», автори вважають, що «базова модель GPT була навчена з використанням робіт [позивачів] .”

Адвокати письменників також стверджують, що на прохання написати абзац у стилі Дивовижні пригоди Кавалера та Клея, книжка, яка принесла американському романістові Чабону Пулітцера, ChatGPT створив уривок, що імітує його стиль написання та містить посилання на персонажів, які мають справу з «вагою світу у стані війни».

Скріншот зі скарги, додаток А

Скріншот зі скарги, додаток А (натисніть, щоб збільшити)

Команда костюм [PDF] було подано до федерального суду Каліфорнії наприкінці минулого тижня, а вчора його було призначено судді магістрату Сан-Франциско Пітеру Х. Кангу.

OpenAI стикається з кількома позовами щодо авторських прав, у тому числі два в Сан-Франциско, подані романістами Полом Трембле та Моною Авад, а також коміком Сарою Сільверман і романістами Крістофером Голденом і Річардом Кадрі. У цих справах її юристи стверджували, що компанія штучного інтелекту не порушувала закони про авторські права, стверджуючи, що програми LLM ChatGPT захищені доктриною США про «добросовісне використання». Їхній аргумент полягає в тому, що те, як бізнес використовує текст, відповідає вимогам США закон про авторське право, що передбачає винятки щодо добросовісного використання для так званого «трансформаційного використання» твору – реміксу оригіналу, який служить іншій меті чи аудиторії.

Бюро авторських прав США є в даний час пошук коментарів щодо дослідження закону про авторське право та питань політики, які піднімають системи штучного інтелекту.

Захист OpenAI ще не відповів на скаргу Чабона. Ми звернулися до OpenAI за коментарем.

Звинувачення у справі включають пряме та косвенне порушення авторських прав, незаконне видалення інформації про керування авторськими правами, недобросовісну конкуренцію та неправомірне збагачення. Вони вимагають судової заборони на порушення їхніх авторських прав, а також відшкодування невизначених збитків.

Шеф OpenAI Сем Альтман минулого тижня забив перший в історії Індонезії золота віза – тобто тепер він може жити в країні-архіпелажі до 10 років – на знак визнання його потенціалу «генерувати вхідні інвестиції». ®

Часова мітка:

Більше від Реєстр