Câștigătorul premiului Pulitzer și alții dau în judecată OpenAI

Câștigătorul premiului Pulitzer și alții dau în judecată OpenAI

Romancierul american, câștigător al Premiului Pulitzer, Michael Chabon, și câțiva alți scriitori au depus o propunere de acțiune colectivă, acuzând OpenAI de încălcarea drepturilor de autor pentru că și-ar fi implicat munca în seturile de date folosite pentru a antrena modelele din spatele ChatGPT.

Procesul susține că OpenAI „a aruncat o rețea largă pe internet” pentru a capta cel mai cuprinzător set de conținut disponibil pentru a-și antrena mai bine modelele GPT, ceea ce se presupune că „în mod necesar” îl determină „să captureze, să descarce și să copieze lucrări scrise, piese de teatru și articole."

Una dintre cele mai interesante părți ale procesului este o acuzație despre modul în care autorii cred că afacerea cu inteligență artificială a pus mâna pe „două corpuri de cărți bazate pe internet”, pe care observă că OpenAI le numește pur și simplu „Carți1” și „Carți2”. Dosarul susține că, în documentul din iulie 2020 de introducere a GPT-3, „Modelele lingvistice sunt elevi puțini”, OpenAI a dezvăluit că, pe lângă seturile de date ale paginilor web „Common Crawl” și „WebText”, „16% din setul de date de antrenament GPT3”. a venit de la... „Carti1” și „Carti2”.

Procesul scriitorilor continuă susținând că există doar câteva locuri pe internetul public care conțin atât de mult material, susținând că setul de date OpenAI Books1 „se bazează fie pe Proiectul Standardizat Gutenberg Corpus, fie pe Proiectul Gutenberg însuși” și acuzând AI biz că aprovizionare Books2 de la:

site-uri web infame „biblioteca din umbră”, cum ar fi Library Genesis („LibGen”), Z-Library, Sci-Hub și Bibliotik, care găzduiesc colecții masive de cărți piratate, lucrări de cercetare și alte materiale bazate pe text. Materialele agregate de aceste site-uri web au fost, de asemenea, disponibile în vrac prin sisteme torrent.

De asemenea, în costum este inclus și câștigătorul premiului Tony și Grammy David Henry Hwang, dramaturgul și scenaristul din spate. M. Fluture, Chinglish, Fața Galbenă, și Dansul și calea ferată; Câștigătorul Peabody și Dragoste și alte activități imposibile autoarea Ayelet Waldman; Femeile pe care le-am îngropat autoarea Rachel Louise Snyder; și Cine este bogat? scriitorul Matthew Klam.

Scriitorii susțin că, deoarece „atunci când ChatGPT este solicitat, generează nu numai rezumate, ci și analize aprofundate ale temelor prezente în lucrările reclamanților protejate prin drepturi de autor”, scriitorii cred că „modelul GPT de bază a fost antrenat folosind lucrările reclamanților. .”

Avocații scriitorilor mai susțin că atunci când li se cere să scrie un paragraf în stilul de Aventurile uimitoare ale lui Kavalier & Clay, cartea care ia adus romancierului american Chabon Pulitzer-ul său, ChatGPT a generat un pasaj care imit stilul său de scris și include referiri la personajele care se ocupă de „greutatea lumii în război”.

Captură de ecran din plângere, proba A

Captură de ecran din reclamație, expoziție A (click pentru a mări)

costum [PDF] a fost depus la curtea federală din California la sfârșitul săptămânii trecute și a fost repartizat ieri judecătorului Peter H. Kang din San Francisco.

OpenAI se confruntă cu mai multe procese în legătură cu drepturile de autor – inclusiv două în San Francisco intentate de romancierii Paul Tremblay și Mona Awad și, separat, comediantul Sarah Silverman și romancierii Christopher Golden și Richard Kadrey. Avocații săi au susținut în acele cazuri că AI biz nu a încălcat legile privind drepturile de autor, susținând că LLM-urile ChatGPT sunt protejate de doctrina americană a „utilizarii loiale”. Argumentul lor este că modul în care compania utilizează textul este conform cu SUA legea drepturilor de autor, care permite o excepție de utilizare loială pentru așa-numitele „utilizări transformative” ale operei – un remix al originalului care servește unui alt scop sau public.

Oficiul pentru Drepturi de Autor din SUA este în prezent solicită comentarii cu privire la un studiu al legii dreptului de autor și al problemelor de politică ridicate de sistemele de inteligență artificială.

Apărarea pentru OpenAI nu a depus încă un răspuns la plângerea Chabon. Am cerut comentariilor OpenAI.

Acuzațiile din acest caz includ încălcarea directă și indirectă a drepturilor de autor, eliminarea ilegală a informațiilor de gestionare a drepturilor de autor, concurența neloială și îmbogățirea fără drept. Aceștia solicită o acțiune împotriva încălcării drepturilor de autor, precum și a unor daune nespecificate.

Şeful OpenAI, Sam Altman, a marcat săptămâna trecută primul marcat din Indonezia viza de aur – ceea ce înseamnă că acum poate trăi în națiunea arhipelagică până la 10 ani – ca recunoaștere a potențialului său de a „genera investiții de intrare”. ®

Timestamp-ul:

Mai mult de la Registrul