Pulitzerpristagare och andra stämmer OpenAI

Pulitzerpristagare och andra stämmer OpenAI

Pulitzerprisvinnande amerikanska romanförfattaren Michael Chabon och flera andra författare har lämnat in en föreslagen grupptalan där de anklagar OpenAI för intrång i upphovsrätten för att de påstås ha dragit in deras verk i datamängderna som används för att träna modellerna bakom ChatGPT.

Stämningen hävdar att OpenAI "kastar ett brett nät över internet" för att fånga den mest omfattande uppsättningen av innehåll som finns tillgängligt för att bättre träna sina GPT-modeller, vilket påstås "nödvändigtvis" leda till att det "fångar, laddar ner och upphovsrättsskyddade skrivna verk, pjäser och artiklar."

En av de mer intressanta delarna av rättegången är ett påstående om hur författarna tror att AI-verksamheten fick tag på "två internetbaserade bokkorpora", som den noterar att OpenAI helt enkelt refererar till som "Books1" och "Books2." I anmälan påstås att OpenAI i juli 2020-tidningen som introducerade GPT-3, "Språkmodeller är få-shot-lärare", avslöjade att utöver "Common Crawl" och "WebText" webbsidor, "16 procent av GPT3-utbildningsdatasetet kom från... 'Böcker1' och 'Böcker2'."

Författarens rättegång fortsätter med att hävda att det bara finns ett fåtal platser på det offentliga internet som innehåller så mycket material, och hävdar att OpenAI:s Books1-datauppsättning "baseras på antingen det standardiserade Project Gutenberg Corpus eller Project Gutenberg självt" och anklagar AI-branschen för hämtar Books2 från:

ökända "skuggbiblioteks"-webbplatser, som Library Genesis ("LibGen"), Z-Library, Sci-Hub och Bibliotik, som är värd för enorma samlingar av piratkopierade böcker, forskningsartiklar och annat textbaserat material. Materialet som samlats på dessa webbplatser har också varit tillgängligt i bulk genom torrentsystem.

Med i kostymen finns även Tony och Grammy-pristagaren David Henry Hwang, dramatikern och manusförfattaren bakom M. Fjäril, Chinglish, Gult Ansikteoch Dansen och järnvägen; Peabody vinnare och Kärlek och andra omöjliga sysslor författaren Ayelet Waldman; Kvinnor vi begravde författare Rachel Louise Snyder; och Vem är Rich? skriftlärare Matthew Klam.

Författarna hävdar att eftersom "när ChatGPT uppmanas genererar det inte bara sammanfattningar, utan djupgående analyser av de teman som finns i kärandenas upphovsrättsskyddade verk", tror skribenterna att "den underliggande GPT-modellen tränades med hjälp av [kärandenas] verk. .”

Författarnas advokater hävdar också att när de uppmanas att skriva ett stycke i stil med Kavalier & Clays fantastiska äventyr, boken som gav den amerikanske romanförfattaren Chabon sin Pulitzer, skapade ChatGPT en passage som imiterade hans skrivstil och inkluderar referenser till karaktärerna som handlar om "världens tyngd i krig."

Skärmdump från klagomålet, bilaga A

Skärmdump från klagomålet, bilaga A (klicka för att förstora)

Smakämnen dräkten [PDF] lämnades in till Kaliforniens federala domstol i slutet av förra veckan och tilldelades i går San Franciscos domare Peter H. Kang.

OpenAI står inför flera stämningar kring upphovsrätt – inklusive två i San Francisco inlämnade av romanförfattarna Paul Tremblay och Mona Awad, och, separat, komikern Sarah Silverman och romanförfattarna Christopher Golden och Richard Kadrey. Dess advokater hävdade i dessa fall att AI-biz inte har brutit mot upphovsrättslagar, och hävdade att ChatGPT:s LLMs är skyddade enligt USA:s doktrin om "tillåten användning". Deras argument är att företagets sätt att använda texten överensstämmer med USA upphovsrättslag, som tillåter ett fair use-undantag för så kallade ”transformative uses” av arbete – en remix av originalet som tjänar ett annat syfte eller en annan publik.

US Copyright Office är för närvarande söker kommentarer om en studie av upphovsrättslagen och policyfrågor som väckts av system för artificiell intelligens.

Defense for OpenAI har ännu inte lämnat in något svar på Chabon-klagomålet. Vi har bett OpenAI om en kommentar.

Anklagelserna i fallet inkluderar direkta och ställföreträdande upphovsrättsintrång, olaglig borttagning av information om upphovsrättshantering, illojal konkurrens och orättvis berikning. De begär ett föreläggande mot intrång i deras upphovsrätt samt ospecificerade skadestånd.

OpenAI-bossen Sam Altman gjorde förra veckan Indonesiens första mål någonsin gyllene visum – vilket innebär att han nu kan leva i skärgårdsnationen i upp till 10 år – som ett erkännande av sin potential att "generera inkommande investeringar." ®

Tidsstämpel:

Mer från Registret