Американський прозаїк, лауреат Пулітцерівської премії Майкл Чейбон і кілька інших письменників подали запропонований груповий позов, звинувачуючи OpenAI у порушенні авторських прав за те, що вони нібито втягнули їхні роботи в набори даних, які використовуються для навчання моделей ChatGPT.
У позові стверджується, що OpenAI «розгорнув широку мережу через Інтернет», щоб отримати найповніший набір доступного вмісту для кращого навчання своїх моделей GPT, нібито «обов’язково» змушуючи його «захоплювати, завантажувати та копіювати захищені авторським правом письмові твори, п’єси та статті».
Однією з найцікавіших частин позову є твердження про те, як, на думку авторів, AI-бізнес отримав у свої руки «два книжкові корпуси в Інтернеті», які, як зазначається, OpenAI просто називає «Books1» і «Books2». У документі стверджується, що в документі від липня 2020 року, який представляє GPT-3, «Мовні моделі мало хто вивчає», OpenAI розкрив, що окрім наборів даних веб-сторінок «Common Crawl» і «WebText», «16 відсотків набору навчальних даних GPT3 походить із… «Книг1» і «Книг2».
У позові автори стверджують, що в загальнодоступному Інтернеті є лише кілька місць, які містять стільки матеріалів, стверджуючи, що набір даних OpenAI Books1 «базується або на стандартизованому корпусі проекту Гутенберга, або на самому проекті Гутенберга», і звинувачує бізнес штучного інтелекту в джерело Books2 з:
сумнозвісні веб-сайти «тіньових бібліотек», такі як Library Genesis («LibGen»), Z-Library, Sci-Hub і Bibliotik, які містять величезні колекції піратських книг, наукових статей та інших текстових матеріалів. Матеріали, зібрані цими веб-сайтами, також були доступні масово через торрент-системи.
Також у костюм включений лауреат премій Тоні та Греммі Девід Генрі Хван, драматург і сценарист М. Метелик, Чінгліш, Жовте обличчя та Танець і залізниця; Переможець Пібоді і Любов та інші неможливі пошуки автор Аєлет Уолдман; Жінки, яких ми поховали автор Рейчел Луїза Снайдер; і Хто такий багатий? писар Метью Клам.
Автори стверджують, що оскільки «коли запитується ChatGPT, він генерує не лише підсумки, але й глибокий аналіз тем, присутніх у захищених авторським правом роботах позивачів», автори вважають, що «базова модель GPT була навчена з використанням робіт [позивачів] .”
Адвокати письменників також стверджують, що на прохання написати абзац у стилі Дивовижні пригоди Кавалера та Клея, книжка, яка принесла американському романістові Чабону Пулітцера, ChatGPT створив уривок, що імітує його стиль написання та містить посилання на персонажів, які мають справу з «вагою світу у стані війни».
Команда костюм [PDF] було подано до федерального суду Каліфорнії наприкінці минулого тижня, а вчора його було призначено судді магістрату Сан-Франциско Пітеру Х. Кангу.
OpenAI стикається з кількома позовами щодо авторських прав, у тому числі два в Сан-Франциско, подані романістами Полом Трембле та Моною Авад, а також коміком Сарою Сільверман і романістами Крістофером Голденом і Річардом Кадрі. У цих справах її юристи стверджували, що компанія штучного інтелекту не порушувала закони про авторські права, стверджуючи, що програми LLM ChatGPT захищені доктриною США про «добросовісне використання». Їхній аргумент полягає в тому, що те, як бізнес використовує текст, відповідає вимогам США закон про авторське право, що передбачає винятки щодо добросовісного використання для так званого «трансформаційного використання» твору – реміксу оригіналу, який служить іншій меті чи аудиторії.
Бюро авторських прав США є в даний час пошук коментарів щодо дослідження закону про авторське право та питань політики, які піднімають системи штучного інтелекту.
Захист OpenAI ще не відповів на скаргу Чабона. Ми звернулися до OpenAI за коментарем.
Звинувачення у справі включають пряме та косвенне порушення авторських прав, незаконне видалення інформації про керування авторськими правами, недобросовісну конкуренцію та неправомірне збагачення. Вони вимагають судової заборони на порушення їхніх авторських прав, а також відшкодування невизначених збитків.
Шеф OpenAI Сем Альтман минулого тижня забив перший в історії Індонезії золота віза – тобто тепер він може жити в країні-архіпелажі до 10 років – на знак визнання його потенціалу «генерувати вхідні інвестиції». ®
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. Автомобільні / електромобілі, вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- ChartPrime. Розвивайте свою торгову гру за допомогою ChartPrime. Доступ тут.
- BlockOffsets. Модернізація екологічної компенсаційної власності. Доступ тут.
- джерело: https://go.theregister.com/feed/www.theregister.com/2023/09/12/openai_copyright_lawsuits/
- : має
- :є
- : ні
- $UP
- 10
- 16
- 2020
- 7
- a
- МЕНЮ
- через
- дію
- доповнення
- проти
- AI
- Звинувачення
- нібито
- дозволяє
- Також
- дивовижний
- an
- Аналіз
- та
- ЕСТЬ
- сперечався
- аргумент
- навколо
- статті
- штучний
- штучний інтелект
- AS
- призначений
- At
- аудиторія
- автор
- authors
- доступний
- нагорода
- заснований
- оскільки
- було
- за
- Вірити
- Краще
- бізнес
- книга
- книги
- Бос
- бізнес
- але
- by
- Каліфорнія
- прийшов
- CAN
- захоплення
- випадок
- випадків
- Центр
- символи
- ChatGPT
- Крістофер
- стверджувати
- стверджуючи,
- претензій
- клас
- дія Клас
- клацання
- CO
- Колекції
- коментар
- загальний
- конкурс
- скарга
- всеосяжний
- містити
- зміст
- авторське право
- порушення авторських прав
- Авторські права
- Суд
- танець
- набори даних
- Девід
- справу
- різний
- прямий
- скачати
- або
- збільшити
- НІКОЛИ
- виняток
- проявляти
- облицювання
- ярмарок
- Федеральний
- федеральний суд
- кілька
- подано
- Подача
- Перший
- для
- Франциско
- від
- породжувати
- генерується
- генерує
- Книга Буття
- йде
- Золотий
- є
- Гутенберг
- Руки
- Мати
- he
- Генрі
- його
- господар
- Як
- HTTPS
- незаконний
- неможливе
- in
- поглиблений
- включати
- включені
- У тому числі
- Індонезія
- інформація
- порушення
- Інтелект
- цікавий
- інтернет
- Інтернет на основі
- в
- введення
- інвестиції
- питання
- IT
- ЙОГО
- сам
- JPG
- суддя
- липень
- мова
- останній
- Пізно
- закон
- Законодавство
- позов
- судові процеси
- адвокати
- провідний
- бібліотека
- як
- жити
- управління
- масивний
- матеріал
- Матеріали
- Матвій
- сенс
- Майкл
- модель
- Моделі
- більше
- найбільш
- багато
- множинний
- народ
- обов'язково
- мережу
- примітки
- Романист
- зараз
- of
- Office
- on
- тільки
- OpenAI
- or
- оригінал
- Інше
- інші
- сторінка
- Папір
- документи
- частини
- проходження
- Пол
- відсотків
- Пітер
- місця
- plato
- Інформація про дані Платона
- PlatoData
- відіграє
- політика
- потенціал
- представити
- приз
- проект
- запропонований
- захищений
- громадськість
- тягне
- мета
- піднятий
- визнання
- посилання
- відноситься
- Ремікс
- видалення
- дослідження
- відповідь
- Багаті
- Річард
- s
- Сем
- Сем Альтман
- Сан -
- Сан Франциско
- пошук
- служить
- комплект
- кілька
- тінь
- просто
- Про
- Вивчення
- стиль
- пред'являти позов
- костюм
- Systems
- текст
- Що
- Команда
- світ
- їх
- Теми
- Там.
- Ці
- вони
- це
- ті
- через
- до
- Тоні
- потік
- поїзд
- навчений
- Навчання
- перетворювальний
- два
- при
- що лежить в основі
- несправедливо
- us
- використання
- використовуваний
- використовує
- використання
- порушено
- війна
- було
- шлях..
- we
- Web
- веб-сайти
- week
- вага
- ДОБРЕ
- коли
- який
- широкий
- переможець
- перемога
- з
- Work
- працює
- світ
- запис
- письменники
- лист
- письмовий
- років
- вчора
- ще
- зефірнет