O romancista americano vencedor do Prêmio Pulitzer, Michael Chabon, e vários outros escritores entraram com uma proposta de ação coletiva acusando a OpenAI de violação de direitos autorais por supostamente inserir seu trabalho nos conjuntos de dados usados para treinar os modelos por trás do ChatGPT.
O processo afirma que a OpenAI “lançou uma ampla rede na Internet” para capturar o conjunto mais abrangente de conteúdo disponível para melhor treinar seus modelos GPT, supostamente “necessariamente” levando-a “a capturar, baixar e copiar obras escritas protegidas por direitos autorais, peças e artigos.”
Uma das partes mais interessantes do processo é uma alegação sobre como os autores acreditam que o negócio de IA colocou as mãos em “dois corpora de livros baseados na Internet”, aos quais observa que a OpenAI simplesmente se refere como “Livros1” e “Livros2”. O processo alega que no artigo de julho de 2020 que apresenta o GPT-3, “Modelos de linguagem são aprendizes de poucos tiros”, a OpenAI divulgou que, além dos conjuntos de dados de páginas da web “Rastreamento comum” e “WebText”, “16 por cento do conjunto de dados de treinamento GPT3 veio de… 'Livros1' e 'Livros2'.”
O processo dos escritores prossegue alegando que existem apenas alguns lugares na Internet pública que contêm tanto material, alegando que o conjunto de dados Books1 da OpenAI “é baseado no Corpus Padronizado do Projeto Gutenberg ou no próprio Projeto Gutenberg” e acusando o negócio de IA de adquirindo Books2 de:
sites infames de “bibliotecas sombra”, como Library Genesis (“LibGen”), Z-Library, Sci-Hub e Bibliotik, que hospedam enormes coleções de livros piratas, artigos de pesquisa e outros materiais baseados em texto. Os materiais agregados por esses sites também estão disponíveis em massa através de sistemas de torrent.
Também incluído no processo está o vencedor do Tony e do Grammy David Henry Hwang, o dramaturgo e roteirista por trás M. Borboleta, Chinglish, Yellowface e A dança e a ferrovia; Vencedor Peabody e Amor e outras buscas impossíveis autora Ayelet Waldman; Mulheres que enterramos autora Rachel Louise Snyder; e Quem é Rico? escriba Matthew Klam.
Os redatores alegam que porque “quando o ChatGPT é solicitado, ele gera não apenas resumos, mas análises aprofundadas dos temas presentes nas obras protegidas por direitos autorais dos Requerentes”, os redatores acreditam que “o modelo GPT subjacente foi treinado usando [os] trabalhos dos Requerentes .”
Os advogados dos escritores também afirmam que, quando solicitados a escrever um parágrafo no estilo As incríveis aventuras de Kavalier & Clay, livro que rendeu ao romancista americano Chabon seu Pulitzer, ChatGPT gerou uma passagem imitando seu estilo de escrita e incluindo referências aos personagens que lidam com “o peso do mundo em guerra”.
A terno [PDF] foi apresentado no tribunal federal da Califórnia no final da semana passada e ontem atribuído ao juiz magistrado de São Francisco, Peter H. Kang.
A OpenAI está enfrentando vários processos judiciais relacionados a direitos autorais – incluindo dois em São Francisco movidos pelos romancistas Paul Tremblay e Mona Awad e, separadamente, pela comediante Sarah Silverman e pelos romancistas Christopher Golden e Richard Kadrey. Seus advogados argumentaram nesses casos que o negócio da IA não violou as leis de direitos autorais, alegando que os LLMs do ChatGPT estão protegidos pela doutrina dos EUA de “uso justo”. O argumento deles é que a forma como a empresa usa o texto está em conformidade com as normas dos EUA. lei de direitos autorais, que permite uma exceção de uso justo para os chamados “usos transformadores” da obra – um remix do original que serve um propósito ou público diferente.
O Escritório de Direitos Autorais dos EUA é atualmente buscando comentários sobre um estudo sobre a lei de direitos autorais e questões políticas levantadas por sistemas de inteligência artificial.
A defesa da OpenAI ainda não apresentou uma resposta à reclamação de Chabon. Pedimos comentários à OpenAI.
As alegações no caso incluem violação direta e indireta de direitos autorais, remoção ilegal de informações de gestão de direitos autorais, concorrência desleal e enriquecimento sem causa. Eles estão buscando uma liminar contra a violação de seus direitos autorais, bem como por danos não especificados.
O chefe da OpenAI, Sam Altman, marcou na semana passada o primeiro gol da Indonésia Visto Gold – o que significa que ele pode agora viver na nação arquipelágica por até 10 anos – em reconhecimento do seu potencial para “gerar investimento estrangeiro”. ®
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
- PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
- PlatãoESG. Automotivo / EVs, Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
- PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
- ChartPrime. Eleve seu jogo de negociação com ChartPrime. Acesse aqui.
- BlockOffsets. Modernizando a Propriedade de Compensação Ambiental. Acesse aqui.
- Fonte: https://go.theregister.com/feed/www.theregister.com/2023/09/12/openai_copyright_lawsuits/
- :tem
- :é
- :não
- $UP
- 10
- 16
- 2020
- 7
- a
- Sobre
- em
- Açao Social
- Adição
- contra
- AI
- Alegações
- alegadamente
- permite
- tb
- surpreendente
- an
- Analisa
- e
- SOMOS
- argumentou
- argumento
- por aí
- artigos
- artificial
- inteligência artificial
- AS
- atribuído
- At
- público
- autor
- autores
- disponível
- prêmio
- baseado
- Porque
- sido
- atrás
- Acreditar
- Melhor
- biz
- livro
- Livros
- CHEFE
- negócio
- mas a
- by
- Califórnia
- veio
- CAN
- capturar
- casas
- casos
- Centralização de
- caracteres
- ChatGPT
- Christopher
- reivindicar
- reivindicando
- reivindicações
- classe
- Ação Coletiva
- clique
- CO
- coleções
- comentar
- comum
- competição
- reclamação
- compreensivo
- não contenho
- conteúdo
- direitos autorais
- violação de direitos autorais
- Copyrights
- Tribunal de
- dança
- conjuntos de dados
- David
- lidar
- diferente
- diretamente
- download
- ou
- prolongar
- SEMPRE
- exceção
- apresentar
- enfrentando
- feira
- Federal
- corte federal
- poucos
- arquivada
- Arquivamento
- Primeiro nome
- Escolha
- Francisco
- da
- gerar
- gerado
- gera
- Gênese
- vai
- Dourado
- tem
- Gutenberg
- mãos
- Ter
- he
- henry
- sua
- hospedeiro
- Como funciona o dobrador de carta de canal
- HTTPS
- Ilegal
- impossível
- in
- em profundidade
- incluir
- incluído
- Incluindo
- Indonésia
- INFORMAÇÕES
- violação
- Inteligência
- interessante
- Internet
- Baseado na Internet
- para dentro
- introduzindo
- investimento
- questões
- IT
- ESTÁ
- se
- jpg
- juiz
- Julho
- língua
- Sobrenome
- Atrasado
- Escritórios de
- Leis
- ação judicial
- Ações judiciais
- Advogados
- principal
- Biblioteca
- como
- viver
- de grupos
- maciço
- material
- materiais
- Mateus
- significado
- Michael
- modelo
- modelos
- mais
- a maioria
- muito
- múltiplo
- nação
- necessariamente
- líquido
- Notas
- Romancista
- agora
- of
- Office
- on
- só
- OpenAI
- or
- original
- Outros
- Outros
- página
- Papel
- papéis
- peças
- passagem
- Paul
- por cento
- Peter
- Locais
- platão
- Inteligência de Dados Platão
- PlatãoData
- desempenha
- Privacidade
- potencial
- presente
- prêmio
- projeto
- proposto
- protegido
- público
- puxando
- propósito
- angariado
- reconhecimento
- referências
- refere-se
- Remix
- remoção
- pesquisa
- resposta
- Rico
- Richard
- s
- Sam
- Sam Altman
- San
- San Francisco
- busca
- serve
- conjunto
- vários
- Shadow
- simplesmente
- Origem
- Estudo
- estilo
- processar
- terno
- sistemas
- texto
- que
- A
- o mundo
- deles
- temas
- Lá.
- Este
- deles
- isto
- aqueles
- Através da
- para
- Tony
- torrente
- Trem
- treinado
- Training
- transformadora
- dois
- para
- subjacente
- Injusto
- us
- usar
- usava
- usos
- utilização
- violados
- guerra
- foi
- Caminho..
- we
- web
- sites
- semana
- peso
- BEM
- quando
- qual
- Largo
- vencedor
- vitória
- de
- Atividades:
- trabalho
- mundo
- escrever
- escritores
- escrita
- escrito
- anos
- ontem
- ainda
- zefirnet