Dobitnik Pulitzerjeve nagrade in drugi tožijo OpenAI

Dobitnik Pulitzerjeve nagrade in drugi tožijo OpenAI

Pulitzerjev nagrajenec, ameriški romanopisec Michael Chabon in številni drugi pisatelji so vložili predlagano skupinsko tožbo, v kateri OpenAI obtožujejo kršitve avtorskih pravic, ker naj bi njihovo delo potegnilo v nabore podatkov, ki se uporabljajo za usposabljanje modelov za ChatGPT.

V tožbi je navedeno, da je OpenAI »razkril široko mrežo po internetu«, da bi zajel najobsežnejši nabor vsebine, ki je na voljo za boljše usposabljanje svojih modelov GPT, kar naj bi ga »nujno« vodilo k »zajemu, prenosu in kopiranju avtorsko zaščitenih pisnih del, iger in članki."

Eden od bolj zanimivih delov tožbe je obtožba o tem, kako avtorji verjamejo, da se je posel z umetno inteligenco dokopal do "dveh internetnih knjižnih korpusov", ki ju OpenAI preprosto imenuje "Knjige1" in "Knjige2". V vlogi je navedeno, da je OpenAI v dokumentu iz julija 2020, ki predstavlja GPT-3, »Jezikovni modeli so redki učenci«, razkril, da je poleg podatkovnih nizov spletnih strani »Common Crawl« in »WebText« »16 odstotkov nabora podatkov za usposabljanje GPT3 prišel iz ... 'Knjige1' in 'Knjige2'.«

Tožba avtorjev nadalje trdi, da obstaja le nekaj mest na javnem internetu, ki vsebujejo toliko gradiva, in trdi, da nabor podatkov OpenAI Books1 "temelji bodisi na Standardiziranem korpusu projekta Gutenberg bodisi na samem projektu Gutenberg" in obtožuje podjetje AI, da pridobivanje knjig 2 od:

razvpita spletna mesta »knjižnic v senci«, kot so Library Genesis (»LibGen«), Z-Library, Sci-Hub in Bibliotik, ki gostijo ogromne zbirke piratskih knjig, raziskovalnih člankov in drugega besedilnega gradiva. Gradivo, zbrano na teh spletnih mestih, je bilo na voljo tudi v velikem obsegu prek torrent sistemov.

V obleko je vključen tudi dobitnik Tonyja in grammyja David Henry Hwang, dramatik in scenarist M. Metulj, Chinglish, Rumeni obrazin Ples in železnica; Peabody zmagovalec in Ljubezen in druga nemogoča iskanja avtorica Ayelet Waldman; Ženske, ki smo jih pokopali avtorica Rachel Louise Snyder; in Kdo je Rich? pisar Matej Klam.

Pisci trdijo, da zato, ker »ko je pozvan ChatGPT, ustvari ne le povzetke, temveč tudi poglobljene analize tem, ki so prisotne v avtorsko zaščitenih delih tožnikov,« pisci menijo, da je bil »osnovni model GPT usposobljen z uporabo [] del tožnikov .”

Odvetniki pisateljev tudi trdijo, da ko so jih prosili, naj napišejo odstavek v slogu Neverjetne dogodivščine Kavalier & Clay, knjiga, ki je ameriškemu romanopiscu Chabonu prinesla Pulitzerja, je ChatGPT ustvaril odlomek, ki posnema njegov slog pisanja in vključuje sklicevanja na like, ki se ukvarjajo s »težo sveta v vojni«.

Posnetek zaslona iz pritožbe, dokaz A

Posnetek zaslona iz pritožbe, dokaz A (kliknite za povečavo)

O obleka [PDF] je bil vložen na kalifornijskem zveznem sodišču konec prejšnjega tedna in je bil včeraj dodeljen sodniku za prekrške v San Franciscu Petru H. Kangu.

OpenAI se sooča s številnimi tožbami glede avtorskih pravic – vključno z dvema v San Franciscu, ki sta ju vložila romanopisca Paul Tremblay in Mona Awad ter ločeno komičarka Sarah Silverman ter romanopisca Christopher Golden in Richard Kadrey. Njeni odvetniki so v teh primerih trdili, da AI biz ni kršil zakonov o avtorskih pravicah, in trdili, da so LLM ChatGPT zaščiteni v skladu z ameriško doktrino "poštene uporabe". Njihov argument je, da je način, kako podjetje uporablja besedilo, v skladu z ZDA avtorsko pravo, ki dovoljuje izjemo poštene uporabe za tako imenovane »transformativne uporabe« dela – remiks izvirnika, ki služi drugemu namenu ali občinstvu.

Urad ZDA za avtorske pravice je Trenutno iščejo komentarje o študiji zakonodaje o avtorskih pravicah in političnih vprašanjih, ki jih odpirajo sistemi umetne inteligence.

Obramba za OpenAI še ni vložila odgovora na pritožbo Chabona. OpenAI smo prosili za komentar.

Obtožbe v primeru vključujejo neposredno in stransko kršitev avtorskih pravic, nezakonito odstranitev informacij o upravljanju avtorskih pravic, nelojalno konkurenco in neupravičeno obogatitev. Zahtevajo sodno prepoved kršitve njihovih avtorskih pravic in nedoločeno škodo.

Šef OpenAI Sam Altman je prejšnji teden dosegel prvi zadetek za Indonezijo zlati vizum – kar pomeni, da lahko zdaj živi v arhipelaški državi do 10 let – kot priznanje njegovemu potencialu za "ustvarjanje vhodnih naložb." ®

Časovni žig:

Več od Register