Authors Guild processa OpenAI por usar livros para treinar ChatGPT

Authors Guild processa OpenAI por usar livros para treinar ChatGPT

Authors Guild processa OpenAI por usar livros para treinar ChatGPT PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

A Authors Guild, uma associação comercial para escritores publicados, e 17 autores soltaram os dragões na OpenAI por causa do suposto uso de suas obras para treinar seus chatbots.

Os autores nomeados na ação coletiva por violação de direitos autorais - movida no Distrito Sul de Nova York por direitos autorais - incluem David Baldacci, Mary Bly, Michael Connelly, Sylvia Day, Jonathan Franzen, John Grisham, Elin Hilderbrand, Christina Baker Kline, Maya Shanbhag Lang , Victor LaValle, George RR Martin, Jodi Picoult, Douglas Preston, Roxana Robinson, George Saunders, Scott Turow e Rachel Vail.

A reclamação [PDF] argumenta que os serviços da OpenAI “põem em perigo a capacidade dos escritores de ficção de ganhar a vida, na medida em que os grandes modelos de linguagem permitem que qualquer pessoa gere – automática e livremente (ou muito barato) – textos que, de outra forma, pagariam aos escritores para criar”.

Os escribas estão descontentes com o fato de a OpenAI não apenas ter treinado seus modelos em seu trabalho sem permissão, mas também com o fato de os sistemas de IA copiarem injustamente sua escrita ao responder às solicitações das pessoas, ou pelo menos é o que se alega.

A reclamação aponta que o ChatGPT foi solicitado com sucesso a criar um “esboço detalhado para um livro prequel para Um jogo dos tronos …usando os mesmos personagens dos livros existentes de Martin na série Uma Canção de Gelo e Fogo.” Resultados semelhantes foram possíveis para os demais autores que aderiram à ação.

A capacidade do ChatGPT de fazer isso é problemática, visto que os autores disseram que não autorizaram a OpenAI a acessar seus trabalhos, como parece ter feito. Os escritores acreditam que quando o laboratório de IA inseriu seu trabalho no modelo durante o treinamento, isso representou uma cópia não autorizada e que os modelos GPT produziram derivados ilegais de trabalhos protegidos por direitos autorais.

“No centro desses algoritmos está o roubo sistemático em grande escala”, alega a documentação do processo.

A reclamação afirma que a OpenAI admitiu usar conjuntos de dados denominados “Books1” e “Books2” para treinar seus grandes modelos de linguagem, mas não divulgou seu conteúdo. Os demandantes suspeitam que livros piratas tenham entrado nos dados de treinamento da OpenAI.

“O crescimento em poder e sofisticação do GPT-3 para o GPT-4 sugere um crescimento correlativo no tamanho dos conjuntos de dados de 'treinamento', levantando a inferência de que uma ou mais fontes muito grandes de e-books piratas discutidas acima devem ter sido usadas para ' train' GPT-4”, argumenta a reclamação, acrescentando “Não há outra maneira de a OpenAI ter obtido o volume de livros necessários para ‘treinar’ um LLM poderoso como o GPT-4.”

Na verdade, a reclamação menciona outra forma: pagar pelo conteúdo utilizado para treinar o ChatGPT. Mas o processo alega que a OpenAI nunca pensou em fazê-lo e cita o depoimento do CEO Sam Altman ao Congresso de que acredita em direitos autorais e pagou por alguns dados de treinamento.

“Para os escritores de ficção, o uso não autorizado de seu trabalho pela OpenAI é um roubo de identidade em grande escala”, afirmou a CEO do Authors Guild, Mary Rasenberger.

“Os autores de ficção criam mundos inteiramente novos a partir da sua imaginação – eles criam os lugares, as pessoas e os eventos nas suas histórias”, acrescentou ela, antes de lamentar: “As pessoas já estão a distribuir conteúdo gerado por versões do GPT que imitam ou utilizam autores originais 'personagens e histórias. As empresas estão vendendo avisos que permitem “entrar no mundo” dos livros de um autor. Estas são violações claras dos direitos de propriedade intelectual dos criadores originais.”

Os demandantes querem “indenizações pela oportunidade perdida de licenciar suas obras e pela usurpação de mercado que os Réus [OpenAI] permitiram ao tornar os Requerentes cúmplices relutantes em sua própria substituição; e uma liminar permanente para evitar que esses danos se repitam.”

O registro pediu comentários à OpenAI e atualizará esta história se recebermos uma resposta substancial. ®

Carimbo de hora:

Mais de O registro