Гильдия авторов подала в суд на OpenAI за использование книг для обучения ChatGPT

Гильдия авторов подала в суд на OpenAI за использование книг для обучения ChatGPT

Гильдия авторов подает в суд на OpenAI за использование книг для обучения ChatGPT PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Гильдия авторов, торговая ассоциация публикуемых писателей, и 17 авторов выпустили драконов на OpenAI из-за предполагаемого использования их произведений для обучения своих чат-ботов.

В число истцов по групповому иску о нарушении авторских прав, поданному в Южном округе Нью-Йорка по защите авторских прав, входят Дэвид Балдаччи, Мэри Блай, Майкл Коннелли, Сильвия Дэй, Джонатан Франзен, Джон Гришэм, Элин Хильдербранд, Кристина Бейкер Клайн, Майя Шанбхаг Ланг. , Виктор ЛаВалль, Джордж Р. Р. Мартин, Джоди Пиколт, Дуглас Престон, Роксана Робинсон, Джордж Сондерс, Скотт Туроу и Рэйчел Вейл.

Ассоциация жалоба [PDF] утверждает, что услуги OpenAI «ставят под угрозу способность писателей-фантастов зарабатывать на жизнь, поскольку большие языковые модели позволяют любому генерировать – автоматически и бесплатно (или очень дешево) – тексты, за создание которых в противном случае пришлось бы платить писателям».

Авторы недовольны не только тем, что OpenAI без разрешения обучает свои модели их работе, но и тем, что системы ИИ несправедливо копируют их тексты, отвечая на запросы людей, или так утверждается.

В жалобе отмечается, что ChatGPT успешно предложили создать «подробный план книги-приквела, Игра престолов … используя тех же персонажей из существующих книг Мартина в этой серии A Song of Ice and Fire». Аналогичные результаты были возможны и для других авторов, присоединившихся к иску.

Способность ChatGPT сделать это проблематична, поскольку авторы заявили, что не разрешали OpenAI получать доступ к своим работам, как это, по всей видимости, было сделано. Авторы полагают, что когда лаборатория искусственного интеллекта ввела свою работу в модель во время обучения, это было равносильно несанкционированному копированию и что модели GPT выдают незаконные производные работы, защищенные авторским правом.

«В основе этих алгоритмов лежит систематическое массовое воровство», — утверждается в документах иска.

В жалобе говорится, что OpenAI призналась в использовании наборов данных под названием «Books1» и «Books2» для обучения своих больших языковых моделей, но не раскрыла их содержание. Истцы подозревают, что пиратские книги проникли в данные обучения OpenAI.

«Рост мощности и сложности от GPT-3 к GPT-4 предполагает соответствующий рост размера «обучающих» наборов данных, что позволяет сделать вывод о том, что один или несколько очень крупных источников пиратских электронных книг, обсуждавшихся выше, должны были использоваться для « обучать GPT-4», — утверждается в жалобе, добавляя: «Не существует другого способа, которым OpenAI мог бы получить объем книг, необходимый для «обучения» мощного LLM, такого как GPT-4».

На самом деле в жалобе упоминается еще один способ: оплата контента, используемого для обучения ChatGPT. Но в иске утверждается, что OpenAI никогда не думала об этом, и цитируются показания генерального директора Сэма Альтмана Конгрессу о том, что он верит в авторское право и заплатил за некоторые обучающие данные.

«Для писателей-фантастов несанкционированное использование OpenAI их работ является кражей личных данных в больших масштабах», — заявила генеральный директор Гильдии авторов Мэри Расенбергер.

«Авторы художественной литературы создают совершенно новые миры из своего воображения — они создают места, людей и события в своих историях», — добавила она, прежде чем посетовать: «Люди уже распространяют контент, созданный версиями GPT, которые имитируют или используют оригинальных авторов. » персонажи и истории. Компании продают подсказки, которые позволяют «войти в мир» авторских книг. Это явное нарушение прав интеллектуальной собственности первоначальных создателей».

Истцы требуют «возмещения ущерба за упущенную возможность лицензировать свои произведения, а также за узурпацию рынка, которую Ответчики [OpenAI] осуществили, сделав Истцов невольными соучастниками в своей собственной замене; и постоянный запрет на предотвращение повторения этого вреда».

Регистр обратился к OpenAI за комментариями и обновит эту историю, если получим содержательный ответ. ®

Отметка времени:

Больше от Регистр