Winnaar van de Pulitzerprijs en anderen klagen OpenAI aan

Winnaar van de Pulitzerprijs en anderen klagen OpenAI aan

De Amerikaanse schrijver Michael Chabon, winnaar van de Pulitzerprijs, en verschillende andere schrijvers hebben een voorgestelde class action ingediend waarin ze OpenAI beschuldigen van inbreuk op het auteursrecht omdat ze naar verluidt hun werk in de datasets hebben opgenomen die worden gebruikt om de modellen achter ChatGPT te trainen.

De rechtszaak beweert dat OpenAI โ€œeen breed net over het internet heeft verspreidโ€ om de meest uitgebreide set inhoud vast te leggen die beschikbaar is om zijn GPT-modellen beter te trainen, waardoor het โ€œnoodzakelijkerwijsโ€ ertoe zou leiden โ€œauteursrechtelijk beschermde geschreven werken, toneelstukken en films vast te leggen, te downloaden en te kopiรซrenโ€. Lidwoord."

Een van de interessantere delen van de rechtszaak is een aantijging over hoe de auteurs denken dat de AI-business โ€˜twee op internet gebaseerde boekencorporaโ€™ in handen heeft gekregen, waarvan OpenAI opmerkt dat het eenvoudigweg โ€˜Boeken1โ€™ en โ€˜Boeken2โ€™ noemt. De indiening beweert dat OpenAI in het artikel uit juli 2020 waarin GPT-3 werd geรฏntroduceerd, โ€œLanguage Models are Few-Shot Learnersโ€, onthulde dat naast de datasets โ€œCommon Crawlโ€ en โ€œWebTextโ€ webpagina-datasets โ€œ16 procent van de GPT3-trainingsdataset kwam vanโ€ฆ 'Boeken1' en 'Boeken2'.โ€

De rechtszaak van de schrijvers gaat verder met te beweren dat er maar een paar plaatsen op het openbare internet zijn die zoveel materiaal bevatten, waarbij wordt beweerd dat OpenAI's Books1-dataset โ€œgebaseerd is op het gestandaardiseerde Project Gutenberg Corpus of op Project Gutenberg zelfโ€ en de AI-biz wordt beschuldigd van Boeken2 betrekken van:

beruchte โ€œschaduwbibliotheekโ€-websites, zoals Library Genesis (โ€œLibGenโ€), Z-Library, Sci-Hub en Bibliotik, die enorme collecties illegale boeken, onderzoekspapers en ander op tekst gebaseerd materiaal hosten. Het door deze websites verzamelde materiaal is ook in bulk beschikbaar via torrent-systemen.

Ook in de rechtszaak zit Tony en Grammy Award-winnaar David Henry Hwang, de toneelschrijver en scenarioschrijver erachter M. Butterfly, Chinglish, Geel gezicht en De dans en de spoorweg; Peabody-winnaar en Liefde en andere onmogelijke bezigheden auteur Ayelet Waldman; Vrouwen die we hebben begraven auteur Rachel Louise Snyder; En Wie is rijk? schrijver Matthew Klam.

De schrijvers beweren dat, omdat "wanneer ChatGPT wordt gevraagd, het niet alleen samenvattingen genereert, maar ook diepgaande analyses van de thema's die aanwezig zijn in de auteursrechtelijk beschermde werken van eisers", de schrijvers geloven dat "het onderliggende GPT-model is getraind met behulp van de werken van [de] eisers". .โ€

De advocaten van de schrijvers beweren ook dat wanneer hen wordt gevraagd een paragraaf in de stijl van te schrijven De geweldige avonturen van Kavalier & Clay, het boek dat de Amerikaanse schrijver Chabon zijn Pulitzer bezorgde, genereerde ChatGPT een passage die zijn schrijfstijl imiteerde en verwijzingen bevatte naar de personages die te maken hadden met โ€˜het gewicht van de wereld in oorlogโ€™.

Screenshot van de klacht, productie A

Screenshot van de klacht, productie A (klik om te vergroten)

De pak [PDF] werd eind vorige week ingediend bij de federale rechtbank van Californiรซ en werd gisteren toegewezen aan magistraatrechter Peter H. Kang uit San Francisco.

OpenAI wordt geconfronteerd met meerdere rechtszaken rond auteursrecht โ€“ waaronder twee in San Francisco, aangespannen door romanschrijvers Paul Tremblay en Mona Awad, en afzonderlijk door cabaretier Sarah Silverman en romanschrijvers Christopher Golden en Richard Kadrey. De advocaten voerden in die zaken aan dat de AI-biz de auteursrechtwetten niet heeft overtreden en beweerden dat de LLMโ€™s van ChatGPT beschermd zijn onder de Amerikaanse doctrine van โ€˜fair useโ€™. Hun argument is dat de manier waarop het bedrijf de tekst gebruikt, in overeenstemming is met de Amerikaanse wetgeving auteursrecht, die een uitzondering op redelijk gebruik toestaat voor zogenaamd โ€˜transformatief gebruikโ€™ van werk โ€“ een remix van het origineel die een ander doel of een ander publiek dient.

Het Amerikaanse Copyright Office is dat wel momenteel op zoek naar commentaar op een onderzoek naar de auteursrechtwetgeving en beleidskwesties die door kunstmatige intelligentiesystemen worden opgeworpen.

Defense for OpenAI heeft nog geen reactie ingediend op de Chabon-klacht. We hebben OpenAI om commentaar gevraagd.

De beschuldigingen in de zaak omvatten directe en indirecte schending van het auteursrecht, illegale verwijdering van informatie over auteursrechtbeheer, oneerlijke concurrentie en ongerechtvaardigde verrijking. Ze eisen een gerechtelijk bevel tegen de inbreuk op hun auteursrechten en een niet-gespecificeerde schadevergoeding.

OpenAI-baas Sam Altman scoorde vorige week de allereerste van Indonesiรซ gouden visum โ€“ wat betekent dat hij nu maximaal tien jaar in de archipel kan wonen โ€“ als erkenning voor zijn potentieel om โ€˜inkomende investeringen te genererenโ€™. ยฎ

Tijdstempel:

Meer van Het register