OpenAI ha fatto causa, ancora una volta, per aver recuperato e replicato notizie

OpenAI ha fatto causa, ancora una volta, per aver recuperato e replicato notizie

OpenAI ha fatto causa, ancora una volta, per aver recuperato e replicato le notizie PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Tre editori digitali hanno citato in giudizio OpenAI sostenendo di aver rubato i loro articoli protetti da copyright per addestrare ChatGPT in due cause legali separate intentate mercoledì.

ChatGPT è stato addestrato su enormi porzioni di testo recuperate da Internet, tra cui molto giornalismo. Gli editori di notizie, tuttavia, non sono contenti che OpenAI abbia utilizzato i loro articoli per addestrare i suoi modelli senza permesso o compenso, e il New York Times ha già denunciato OpenAI sul problema.

The Intercept, Raw Story e AlterNet sono le ultime organizzazioni mediatiche a citare in giudizio OpenAI per violazione del copyright. L'Intercept ha archiviato un caso e, poiché Raw Story e AlterNet sono di proprietà della stessa entità, ha archiviato l'altro. Entrambi i casi sono gestiti dallo stesso studio legale, Loevy & Loevy.

L'Intercept ha anche preso di mira Microsoft, che sostiene OpenAI e utilizza la tecnologia del super laboratorio, nel suo caso.

Entrambe le cause accusano gli imputati di violazione del copyright e di violazione del Digital Millennium Copyright Act, che vieta di rimuovere i nomi degli autori e i titoli delle loro opere per nascondere il furto di proprietà intellettuale.

"Quando hanno popolato i loro set di formazione con opere di giornalismo, gli imputati hanno avuto una scelta: potevano addestrare ChatGPT utilizzando opere di giornalismo con le informazioni sulla gestione del copyright protette dal DMCA intatte, oppure potevano eliminarle", i documenti del tribunale nel caso avviato da Raw Story e dallo stato AltNet[PDF].

"Gli imputati hanno scelto quest'ultima opzione e, nel processo, hanno addestrato ChatGPT a non riconoscere o rispettare il copyright, a non avvisare gli utenti di ChatGPT quando le risposte ricevute erano protette dai diritti d'autore dei giornalisti e a non fornire attribuzioni quando si utilizzano opere di giornalisti umani. "

Simili affermazioni di violazione del DMCA, avanzate dagli scrittori in a processo precedente contro OpenAI, non ci sono riusciti.

Gli avvocati che rappresentano The Intercept, Raw Story e AlterNet hanno affermato che non è chiaro quale testo OpenAI e Microsoft utilizzino per addestrare i loro modelli, ma hanno indicato tre set di dati – WebText, WebText2 e Common Crawl – che ritengono includano il contenuto dei querelanti. Gli avvocati ritengono che gli articoli di tutti e tre gli editori siano stati raschiati e sostengono che ChatGPT generi contenuti che imitano "quantità significative" di materiale giornalistico protetto da copyright "almeno una parte del tempo".

"Sulla base delle informazioni disponibili al pubblico sopra descritte, migliaia di opere protette da copyright dei Querelanti sono state incluse nei set di formazione dei Convenuti senza l'autore, il titolo e le informazioni sul copyright che i Querelanti hanno trasmesso nel pubblicarle", documenti del tribunale [PDF] dallo stato del team legale di The Intercept.

Entrambi i querelanti chiedono il risarcimento dei danni e un'ingiunzione che obblighi gli sviluppatori di chatbot di intelligenza artificiale a rimuovere tutte le copie delle loro opere protette da copyright. Vogliono anche che i giudici del distretto meridionale della corte di New York consentano un processo con giuria.

Il registro ha chiesto un commento a OpenAI e Microsoft. ®

Timestamp:

Di più da Il registro