Vencedor do Prêmio Pulitzer e outros processam OpenAI

Vencedor do Prêmio Pulitzer e outros processam OpenAI

O romancista americano vencedor do Prêmio Pulitzer, Michael Chabon, e vários outros escritores entraram com uma proposta de ação coletiva acusando a OpenAI de violação de direitos autorais por supostamente inserir seu trabalho nos conjuntos de dados usados ​​para treinar os modelos por trás do ChatGPT.

O processo afirma que a OpenAI “lançou uma ampla rede na Internet” para capturar o conjunto mais abrangente de conteúdo disponível para melhor treinar seus modelos GPT, supostamente “necessariamente” levando-a “a capturar, baixar e copiar obras escritas protegidas por direitos autorais, peças e artigos.”

Uma das partes mais interessantes do processo é uma alegação sobre como os autores acreditam que o negócio de IA colocou as mãos em “dois corpora de livros baseados na Internet”, aos quais observa que a OpenAI simplesmente se refere como “Livros1” e “Livros2”. O processo alega que no artigo de julho de 2020 que apresenta o GPT-3, “Modelos de linguagem são aprendizes de poucos tiros”, a OpenAI divulgou que, além dos conjuntos de dados de páginas da web “Rastreamento comum” e “WebText”, “16 por cento do conjunto de dados de treinamento GPT3 veio de… 'Livros1' e 'Livros2'.”

O processo dos escritores prossegue alegando que existem apenas alguns lugares na Internet pública que contêm tanto material, alegando que o conjunto de dados Books1 da OpenAI “é baseado no Corpus Padronizado do Projeto Gutenberg ou no próprio Projeto Gutenberg” e acusando o negócio de IA de adquirindo Books2 de:

sites infames de “bibliotecas sombra”, como Library Genesis (“LibGen”), Z-Library, Sci-Hub e Bibliotik, que hospedam enormes coleções de livros piratas, artigos de pesquisa e outros materiais baseados em texto. Os materiais agregados por esses sites também estão disponíveis em massa através de sistemas de torrent.

Também incluído no processo está o vencedor do Tony e do Grammy David Henry Hwang, o dramaturgo e roteirista por trás M. Borboleta, Chinglish, Yellowface e A dança e a ferrovia; Vencedor Peabody e Amor e outras buscas impossíveis autora Ayelet Waldman; Mulheres que enterramos autora Rachel Louise Snyder; e Quem é Rico? escriba Matthew Klam.

Os redatores alegam que porque “quando o ChatGPT é solicitado, ele gera não apenas resumos, mas análises aprofundadas dos temas presentes nas obras protegidas por direitos autorais dos Requerentes”, os redatores acreditam que “o modelo GPT subjacente foi treinado usando [os] trabalhos dos Requerentes .”

Os advogados dos escritores também afirmam que, quando solicitados a escrever um parágrafo no estilo As incríveis aventuras de Kavalier & Clay, livro que rendeu ao romancista americano Chabon seu Pulitzer, ChatGPT gerou uma passagem imitando seu estilo de escrita e incluindo referências aos personagens que lidam com “o peso do mundo em guerra”.

Captura de tela da reclamação, documento A

Captura de tela da reclamação, documento A (clique para ampliar)

A terno [PDF] foi apresentado no tribunal federal da Califórnia no final da semana passada e ontem atribuído ao juiz magistrado de São Francisco, Peter H. Kang.

A OpenAI está enfrentando vários processos judiciais relacionados a direitos autorais – incluindo dois em São Francisco movidos pelos romancistas Paul Tremblay e Mona Awad e, separadamente, pela comediante Sarah Silverman e pelos romancistas Christopher Golden e Richard Kadrey. Seus advogados argumentaram nesses casos que o negócio da IA ​​não violou as leis de direitos autorais, alegando que os LLMs do ChatGPT estão protegidos pela doutrina dos EUA de “uso justo”. O argumento deles é que a forma como a empresa usa o texto está em conformidade com as normas dos EUA. lei de direitos autorais, que permite uma exceção de uso justo para os chamados “usos transformadores” da obra – um remix do original que serve um propósito ou público diferente.

O Escritório de Direitos Autorais dos EUA é atualmente buscando comentários sobre um estudo sobre a lei de direitos autorais e questões políticas levantadas por sistemas de inteligência artificial.

A defesa da OpenAI ainda não apresentou uma resposta à reclamação de Chabon. Pedimos comentários à OpenAI.

As alegações no caso incluem violação direta e indireta de direitos autorais, remoção ilegal de informações de gestão de direitos autorais, concorrência desleal e enriquecimento sem causa. Eles estão buscando uma liminar contra a violação de seus direitos autorais, bem como por danos não especificados.

O chefe da OpenAI, Sam Altman, marcou na semana passada o primeiro gol da Indonésia Visto Gold – o que significa que ele pode agora viver na nação arquipelágica por até 10 anos – em reconhecimento do seu potencial para “gerar investimento estrangeiro”. ®

Carimbo de hora:

Mais de O registro