Vinder af Pulitzer-prisen og andre sagsøger OpenAI

Vinder af Pulitzer-prisen og andre sagsøger OpenAI

Pulitzer-prisvindende amerikanske romanforfatter Michael Chabon og flere andre forfattere har indgivet et foreslået gruppesøgsmål, hvor de anklager OpenAI for krænkelse af ophavsretten for angiveligt at trække deres arbejde ind i de datasæt, der bruges til at træne modellerne bag ChatGPT.

Sagen hævder, at OpenAI "kaster et bredt net over internettet" for at fange det mest omfattende sæt indhold, der er tilgængeligt for bedre at træne sine GPT-modeller, hvilket angiveligt "nødvendigvis" fører det "til at fange, downloade og ophavsretligt beskyttet skriftlige værker, skuespil og artikler."

En af de mere interessante dele af retssagen er en påstand om, hvordan forfatterne mener, at AI-virksomheden fik fingrene i "to internetbaserede bogkorpora", som den bemærker, at OpenAI blot refererer til som "Books1" og "Books2." Indgivelsen hævder, at OpenAI i juli 2020-avisen, der introducerede GPT-3, "Sprogmodeller er få-skudte elever", afslørede, at ud over "Common Crawl" og "WebText" websidedatasæt, "16 procent af GPT3-træningsdatasættet kom fra... 'Bøger1' og 'Bøger2'."

Forfatterens retssag fortsætter med at hævde, at der kun er nogle få steder på det offentlige internet, der indeholder så meget materiale, og hævder, at OpenAI's Books1-datasæt "er baseret på enten det standardiserede Project Gutenberg Corpus eller Project Gutenberg selv" og anklager AI-biz'en for henter bøger 2 fra:

berygtede "shadow library"-websteder, som Library Genesis ("LibGen"), Z-Library, Sci-Hub og Bibliotik, som er vært for massive samlinger af piratkopierede bøger, forskningsartikler og andre tekstbaserede materialer. Materialerne samlet af disse websteder har også været tilgængelige i bulk gennem torrent-systemer.

Med i dragten er Tony og Grammy-vinderen David Henry Hwang, dramatikeren og manuskriptforfatteren bag M. Sommerfugl, Chinglish, Gult Ansigtog Dansen og Jernbanen; Peabody vinder og Kærlighed og andre umulige sysler forfatter Ayelet Waldman; Kvinder vi begravede forfatter Rachel Louise Snyder; og Hvem er rig? skriver Matthew Klam.

Forfatterne hævder, at fordi "når ChatGPT bliver bedt om, genererer det ikke kun opsummeringer, men dybdegående analyser af de temaer, der er til stede i sagsøgernes ophavsretligt beskyttede værker," mener forfatterne, "den underliggende GPT-model blev trænet ved at bruge [sagsøgernes værker] ."

Forfatternes advokater hævder også, at når de bliver bedt om at skrive et afsnit i stil med Kavalier & Clays fantastiske eventyr, bogen, der gav den amerikanske romanforfatter Chabon sin Pulitzer, genererede ChatGPT en passage, der efterlignede hans skrivestil og inkluderede referencer til karaktererne, der beskæftiger sig med "vægten af ​​verden i krig."

Skærmbillede fra klagen, bilag A

Skærmbillede fra klagen, bilag A (klik for at forstørre)

dragt [PDF] blev indgivet til Californiens føderale domstol i slutningen af ​​sidste uge og blev i går tildelt San Franciscos dommerdommer Peter H. Kang.

OpenAI står over for adskillige retssager omkring ophavsret – herunder to i San Francisco anlagt af romanforfatterne Paul Tremblay og Mona Awad, og hver for sig komikeren Sarah Silverman og romanforfatterne Christopher Golden og Richard Kadrey. Dens advokater hævdede i disse sager, at AI biz ikke har overtrådt ophavsretslovene, idet de hævder, at ChatGPT's LLM'er er beskyttet under den amerikanske doktrin om "fair use." Deres argument er, at den måde, virksomheden bruger teksten på, stemmer overens med USA lov om ophavsret, som tillader en fair use-undtagelse for såkaldte "transformative uses" af værk - et remix af originalen, der tjener et andet formål eller et andet publikum.

US Copyright Office er i øjeblikket søger kommentarer til en undersøgelse af loven om ophavsret og politiske spørgsmål rejst af kunstige intelligenssystemer.

Defense for OpenAI har endnu ikke indgivet et svar på Chabon-klagen. Vi har bedt OpenAI om en kommentar.

Beskyldningerne i sagen omfatter direkte og stedfortrædende ophavsretskrænkelse, ulovlig fjernelse af copyright-administrationsoplysninger, unfair konkurrence og uretfærdig berigelse. De anmoder om et forbud mod krænkelse af deres ophavsrettigheder samt uspecificerede skader.

OpenAI-boss Sam Altman scorede i sidste uge Indonesiens første nogensinde gyldent visa - hvilket betyder, at han nu kan bo i øgruppen i op til 10 år - i erkendelse af hans potentiale til at "generere indgående investeringer." ®

Tidsstempel:

Mere fra Registret