Authors Guild fa causa a OpenAI per aver utilizzato libri per addestrare ChatGPT

Authors Guild fa causa a OpenAI per aver utilizzato libri per addestrare ChatGPT

Authors Guild sues OpenAI for using books to train ChatGPT PlatoBlockchain Data Intelligence. Vertical Search. Ai.

La Authors Guild, un'associazione di categoria per gli scrittori pubblicati, e 17 autori hanno scatenato i draghi su OpenAI per il presunto utilizzo delle loro opere per addestrare i suoi chatbot.

I querelanti nominati nella causa collettiva per violazione del copyright - depositata nel distretto meridionale di New York per copyright - includono David Baldacci, Mary Bly, Michael Connelly, Sylvia Day, Jonathan Franzen, John Grisham, Elin Hilderbrand, Christina Baker Kline, Maya Shanbhag Lang , Victor LaValle, George RR Martin, Jodi Picoult, Douglas Preston, Roxana Robinson, George Saunders, Scott Turow e Rachel Vail.

Il denuncia [PDF] sostiene che i servizi di OpenAI "mettono in pericolo la capacità degli scrittori di narrativa di guadagnarsi da vivere, in quanto i grandi modelli linguistici consentono a chiunque di generare - automaticamente e liberamente (o in modo molto economico) - testi che altrimenti pagherebbero gli scrittori per creare."

Gli scribi sono scontenti non solo del fatto che OpenAI abbia addestrato i suoi modelli sul loro lavoro senza permesso, ma che i sistemi di intelligenza artificiale copino ingiustamente la loro scrittura quando rispondono alle richieste delle persone, o almeno così si presume.

La denuncia sottolinea che ChatGPT è stato indotto con successo a creare uno "schema dettagliato per un libro prequel da A Game of Thrones … utilizzando gli stessi personaggi dei libri esistenti di Martin nella serie Una canzone di ghiaccio e di fuoco.” Risultati simili erano possibili per gli altri autori che hanno aderito alla causa.

La capacità di ChatGPT di farlo è problematica, dato che gli autori hanno affermato di non autorizzare OpenAI ad accedere ai loro lavori come sembra averlo fatto. Gli autori ritengono che quando il laboratorio di intelligenza artificiale ha inserito il proprio lavoro nel modello durante la formazione, ciò equivaleva a una copia non autorizzata e che i modelli GPT producono derivati ​​illegali di lavoro protetto da copyright.

"Al centro di questi algoritmi c'è il furto sistematico su scala di massa", afferma la documentazione della causa.

La denuncia afferma che OpenAI ha ammesso di utilizzare set di dati denominati "Books1" e "Books2" per addestrare i suoi grandi modelli linguistici, ma non ne ha rivelato il contenuto. I querelanti sospettano che i libri pirata siano entrati nei dati di addestramento di OpenAI.

"La crescita in potenza e sofisticazione da GPT-3 a GPT-4 suggerisce una crescita correlativa nella dimensione dei set di dati di 'addestramento', sollevando la deduzione che una o più fonti molto grandi di ebook piratati discusse sopra devono essere state utilizzate per ' train' GPT-4", sostiene la denuncia, aggiungendo "Non c'è altro modo in cui OpenAI avrebbe potuto ottenere il volume di libri necessari per 'addestrare' un potente LLM come GPT-4."

In realtà, il reclamo menziona un altro modo: pagare per il contenuto utilizzato per addestrare ChatGPT. Ma la causa sostiene che OpenAI non ha mai pensato di farlo, e cita la testimonianza del CEO Sam Altman al Congresso secondo cui crede nel diritto d'autore e ha pagato per alcuni dati di formazione.

"Per gli scrittori di narrativa, l'uso non autorizzato del loro lavoro da parte di OpenAI è un furto di identità su larga scala", ha affermato Mary Rasenberger, CEO di Authors Guild.

"Gli autori di narrativa creano mondi completamente nuovi partendo dalla loro immaginazione: creano i luoghi, le persone e gli eventi nelle loro storie", ha aggiunto, prima di lamentarsi: "Le persone stanno già distribuendo contenuti generati da versioni di GPT che imitano o utilizzano autori originali 'personaggi e storie. Le aziende vendono suggerimenti che ti permettono di "entrare nel mondo" dei libri di un autore. Queste sono chiare violazioni dei diritti di proprietà intellettuale dei creatori originali”.

I querelanti vogliono “il risarcimento dei danni per la perduta opportunità di concedere in licenza le proprie opere e per l'usurpazione del mercato che gli imputati [OpenAI] hanno consentito rendendo i querelanti complici involontari della loro stessa sostituzione; e un’ingiunzione permanente per evitare che questi danni si ripetano”.

Il registro ha chiesto a OpenAI un commento e aggiornerà questa storia se riceviamo una risposta sostanziale. ®

Timestamp:

Di più da Il registro