Pulitzer-prisvinner og andre saksøker OpenAI

Pulitzer-prisvinner og andre saksøker OpenAI

Pulitzer-prisvinnende amerikanske romanforfatter Michael Chabon og flere andre forfattere har anlagt et foreslått gruppesøksmål som anklager OpenAI for brudd på opphavsretten for angivelig å ha trukket arbeidet deres inn i datasettene som ble brukt til å trene modellene bak ChatGPT.

Søksmålet hevder at OpenAI "kaster et bredt nett over internett" for å fange opp det mest omfattende innholdssettet som er tilgjengelig for bedre å trene sine GPT-modeller, som angivelig "nødvendigvis" fører det til "til å fange, laste ned og opphavsrettsbeskyttet skriftlige verk, skuespill og artikler."

En av de mer interessante delene av søksmålet er en påstand om hvordan forfatterne mener at AI-virksomheten fikk tak i "to internettbaserte bokkorpora", som den bemerker at OpenAI ganske enkelt refererer til som "Books1" og "Books2." Innleveringen hevder at i juli 2020-artikkelen som introduserte GPT-3, "Språkmodeller er få-skuddslærere", avslørte OpenAI at i tillegg til "Common Crawl" og "WebText" nettsidedatasett, "16 prosent av GPT3-treningsdatasettet kom fra... 'Bøker1' og 'Bøker2'."

Forfattersøksmålet fortsetter med å påstå at det bare er noen få steder på det offentlige internett som inneholder så mye materiale, og hevder at OpenAIs Books1-datasett "er basert på enten det standardiserte Project Gutenberg Corpus eller Project Gutenberg selv" og anklager AI-biz for henter Books2 fra:

beryktede «shadow library»-nettsteder, som Library Genesis («LibGen»), Z-Library, Sci-Hub og Bibliotik, som er vert for enorme samlinger av piratkopierte bøker, forskningsartikler og annet tekstbasert materiale. Materialet samlet av disse nettstedene har også vært tilgjengelig i bulk gjennom torrentsystemer.

Med i drakten er også Tony og Grammy-prisvinneren David Henry Hwang, dramatikeren og manusforfatteren bak M. sommerfugl, Chinglish, Gult ansiktog Dansen og jernbanen; Peabody vinner og Kjærlighet og andre umulige sysler forfatter Ayelet Waldman; Kvinner vi begravde forfatter Rachel Louise Snyder; og Hvem er rik? skribent Matthew Klam.

Forfatterne hevder at fordi "når ChatGPT blir bedt om, genererer det ikke bare sammendrag, men dybdeanalyser av temaene som er tilstede i saksøkernes opphavsrettsbeskyttede verk," mener forfatterne "den underliggende GPT-modellen ble opplært ved å bruke [saksøkernes verker] ."

Forfatternes advokater hevder også at når de blir bedt om å skrive et avsnitt i stil med De fantastiske eventyrene til Kavalier & Clay, boken som ga den amerikanske romanforfatteren Chabon sin Pulitzer, genererte ChatGPT en passasje som imiterte skrivestilen hans og inkluderte referanser til karakterene som omhandler «tyngden av verden i krig».

Skjermbilde fra klagen, utstilling A

Skjermbilde fra klagen, bilag A (klikk for å forstørre)

De dress [PDF] ble arkivert i California føderale domstol sent i forrige uke og ble i går tildelt San Francisco sorenskriverdommer Peter H. Kang.

OpenAI står overfor flere rettssaker rundt opphavsrett – inkludert to i San Francisco anlagt av romanforfatterne Paul Tremblay og Mona Awad, og, hver for seg, komikeren Sarah Silverman og romanforfatterne Christopher Golden og Richard Kadrey. Dets advokater hevdet i disse tilfellene at AI biz ikke har brutt lover om opphavsrett, og hevdet ChatGPTs LLM-er er beskyttet under den amerikanske doktrinen om "rettferdig bruk". Deres argument er at måten virksomheten bruker teksten på, samsvarer med USA lov om opphavsrett, som tillater et rettferdig bruk-unntak for såkalt «transformativ bruk» av arbeid – en remiks av originalen som tjener et annet formål eller publikum.

US Copyright Office er for øyeblikket søker kommentarer til en studie av opphavsrettsloven og politiske spørsmål reist av kunstig intelligens-systemer.

Defense for OpenAI har ennå ikke levert et svar på Chabon-klagen. Vi har bedt OpenAI om kommentar.

Påstandene i saken inkluderer direkte og stedfortredende opphavsrettsbrudd, ulovlig fjerning av informasjon om opphavsrettshåndtering, urettferdig konkurranse og urettferdig berikelse. De ber om et forføyning mot brudd på opphavsretten deres samt uspesifiserte skader.

OpenAI-sjef Sam Altman scoret forrige uke Indonesias første noensinne gyldent visum – noe som betyr at han nå kan bo i skjærgården i opptil 10 år – i erkjennelse av potensialet hans til å «generere inngående investeringer». ®

Tidstempel:

Mer fra Registeret