OpenAI processado, novamente, por copiar e replicar notícias

OpenAI processado, novamente, por copiar e replicar notícias

OpenAI sued, again, for scraping and replicating news PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Três editores digitais processaram a OpenAI por alegações de que ela roubou seus artigos protegidos por direitos autorais para treinar o ChatGPT em dois processos separados movidos na quarta-feira.

O ChatGPT foi treinado em grandes quantidades de texto extraído da Internet, incluindo muito jornalismo. Os editores de notícias, no entanto, não estão satisfeitos com o fato de a OpenAI ter usado seus artigos para treinar seus modelos sem permissão ou compensação, e o New York Times já processou OpenAI sobre o problema.

The Intercept, Raw Story e AlterNet são as mais recentes organizações de mídia a processar a OpenAI por violação de direitos autorais. O Intercept abriu um caso e, como Raw Story e AlterNet são propriedade da mesma entidade, abriu o outro. O mesmo escritório de advocacia, Loevy & Loevy, está administrando ambos os casos.

O Intercept também foi atrás da Microsoft, que apoia o OpenAI e usa a tecnologia do superlaboratório, no seu caso.

Ambos os processos acusam os réus de violação de direitos autorais e de violação da Lei de Direitos Autorais do Milênio Digital, que proíbe a remoção de nomes de autores e títulos de suas obras para ocultar roubo de propriedade intelectual.

“Quando preencheram seus conjuntos de treinamento com trabalhos de jornalismo, os réus tiveram uma escolha: poderiam treinar o ChatGPT usando trabalhos de jornalismo com as informações de gerenciamento de direitos autorais protegidas pelo DMCA intactas, ou poderiam retirá-las”, afirmam os documentos judiciais no caso. iniciado por Raw Story e estado AltNet[PDF].

“Os réus escolheram a última opção e, no processo, treinaram o ChatGPT para não reconhecer ou respeitar os direitos autorais, para não notificar os usuários do ChatGPT quando as respostas que receberam fossem protegidas pelos direitos autorais de jornalistas e para não fornecer atribuição ao usar trabalhos de jornalistas humanos. ”

Alegações semelhantes de violação do DMCA, feitas por escritores em um processo anterior contra OpenAI, não tiveram sucesso.

Os advogados que representam The Intercept, Raw Story e AlterNet disseram que não está claro qual texto a OpenAI e a Microsoft usam para treinar seus modelos, mas apontaram três conjuntos de dados – WebText, WebText2 e Common Crawl – que eles acreditam incluir o conteúdo dos demandantes. Os advogados acreditam que os artigos das três editoras foram copiados e argumentaram que o ChatGPT gera conteúdo que imita “quantidades significativas” de materiais jornalísticos protegidos por direitos autorais “pelo menos algumas vezes”.

“Com base nas informações publicamente disponíveis descritas acima, milhares de trabalhos protegidos por direitos autorais dos Requerentes foram incluídos nos conjuntos de treinamento dos Réus sem o autor, título e informações de direitos autorais que os Requerentes transmitiram ao publicá-los”, documentos judiciais [PDF] da equipe jurídica do The Intercept.

Ambos os demandantes estão buscando indenização e uma liminar forçando os desenvolvedores do chatbot de IA a remover todas as cópias de seus trabalhos protegidos por direitos autorais. Eles também querem que os juízes do Tribunal do Distrito Sul de Nova York permitam um julgamento com júri.

O registro pediu comentários à OpenAI e à Microsoft. ®

Carimbo de hora:

Mais de O registro