Лауреат Пулитцеровской премии и другие подали в суд на OpenAI

Лауреат Пулитцеровской премии и другие подали в суд на OpenAI

Лауреат Пулитцеровской премии американский писатель Майкл Шейбон и несколько других писателей подали коллективный иск, обвиняя OpenAI в нарушении авторских прав за то, что они якобы втянули свои работы в наборы данных, используемые для обучения моделей, лежащих в основе ChatGPT.

В иске утверждается, что OpenAI «раскинула широкую сеть по Интернету», чтобы захватить наиболее полный набор доступного контента, чтобы лучше тренировать свои модели GPT, что якобы «необходимо» заставляет его «захватывать, загружать и копировать письменные произведения, пьесы и произведения, защищенные авторским правом». статьи».

Одной из наиболее интересных частей иска является утверждение о том, как, по мнению авторов, бизнес ИИ заполучил «два интернет-книжных корпуса», которые, как отмечается, OpenAI называет просто «Книги1» и «Книги2». В документе утверждается, что в июльском документе 2020 года, представляющем GPT-3, «Языковые модели изучаются немногими», OpenAI раскрыла, что в дополнение к наборам данных веб-страниц «Common Crawl» и «WebText», «16 процентов набора обучающих данных GPT3 пришло из… «Книг1» и «Книг2».

Далее в иске авторов утверждается, что в общедоступном Интернете есть лишь несколько мест, содержащих такое количество материалов, утверждается, что набор данных OpenAI Books1 «основан либо на стандартизированном корпусе проекта Гутенберг, либо на самом проекте Гутенберг», и обвиняется бизнес ИИ в поиск Books2 из:

печально известные веб-сайты «теневых библиотек», такие как Library Genesis («LibGen»), Z-Library, Sci-Hub и Bibliotik, на которых размещены огромные коллекции пиратских книг, исследовательских работ и других текстовых материалов. Материалы, собранные на этих веб-сайтах, также доступны в большом количестве через торрент-системы.

В костюм также входит обладатель премий «Тони» и «Грэмми» Дэвид Генри Хван, драматург и сценарист. Мадам Баттерфляй, Chinglish, Желтое лицои Танец и железная дорога; Победитель Пибоди и Любовь и другие невозможные стремления автор Айелет Уолдман; Женщины, которых мы похоронили автор Рэйчел Луиза Снайдер; и Кто богат? писец Мэтью Клам.

Авторы утверждают, что поскольку «когда ChatGPT запускается, он генерирует не только резюме, но и углубленный анализ тем, присутствующих в работах истцов, защищенных авторским правом», авторы полагают, что «основная модель GPT была обучена с использованием работ истцов». ».

Адвокаты писателей также утверждают, что, когда их попросили написать абзац в стиле Удивительные приключения Кавалера и КлеяКнига, которая принесла американскому писателю Шейбону Пулитцеровскую премию, ChatGPT создала отрывок, имитирующий его стиль письма и включающий отсылки к персонажам, имеющим дело с «тяжестью мира в состоянии войны».

Скриншот из жалобы, приложение А

Скриншот жалобы, приложение А (нажмите, чтобы увеличить)

Ассоциация Масть [PDF] было подано в федеральный суд Калифорнии в конце прошлой недели и вчера передано мировому судье Сан-Франциско Питеру Х. Кангу.

OpenAI сталкивается с множеством исков по поводу авторских прав, в том числе два в Сан-Франциско, поданные романистами Полом Трембле и Моной Авад, а также комиком Сарой Сильверман и романистами Кристофером Голденом и Ричардом Кадри. В этих случаях его юристы утверждали, что бизнес ИИ не нарушал законы об авторском праве, утверждая, что LLM ChatGPT защищены доктриной США о «добросовестном использовании». Их аргумент заключается в том, что то, как бизнес использует текст, соответствует американским стандартам. авторское право, который допускает исключение по принципу добросовестного использования для так называемых «преобразующих видов использования» произведения – ремикс оригинала, который служит другой цели или аудитории.

Бюро авторских прав США в настоящее время ищет комментарии по поводу исследования закона об авторском праве и политических вопросов, поднятых системами искусственного интеллекта.

Защита OpenAI еще не представила ответ на жалобу Шейбона. Мы попросили OpenAI дать комментарий.

Обвинения по этому делу включают прямое и косвенное нарушение авторских прав, незаконное удаление информации об управлении авторскими правами, недобросовестную конкуренцию и неосновательное обогащение. Они добиваются судебного запрета на нарушение их авторских прав, а также возмещения неуказанного ущерба.

Босс OpenAI Сэм Альтман на прошлой неделе забил первый в истории Индонезии результат. золотая виза – это означает, что теперь он может жить в этой архипелажной стране до 10 лет – в знак признания его потенциала «генерировать приходящие инвестиции». ®

Отметка времени:

Больше от Регистр