Authors Guild poursuit OpenAI pour avoir utilisé des livres pour former ChatGPT

Authors Guild poursuit OpenAI pour avoir utilisé des livres pour former ChatGPT

Authors Guild poursuit OpenAI pour avoir utilisé des livres pour former ChatGPT PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

La Authors Guild, une association professionnelle d'écrivains publiés, et 17 auteurs ont déchaîné les dragons sur OpenAI à cause de son utilisation présumée de leurs œuvres pour former ses chatbots.

Les plaignants nommés dans le recours collectif pour violation du droit d'auteur – déposé dans le district sud de New York pour droit d'auteur – comprennent David Baldacci, Mary Bly, Michael Connelly, Sylvia Day, Jonathan Franzen, John Grisham, Elin Hilderbrand, Christina Baker Kline, Maya Shanbhag Lang. , Victor LaValle, George RR Martin, Jodi Picoult, Douglas Preston, Roxana Robinson, George Saunders, Scott Turow et Rachel Vail.

La plainte [PDF] soutient que les services d'OpenAI « mettent en danger la capacité des écrivains de fiction à gagner leur vie, dans la mesure où les grands modèles linguistiques permettent à quiconque de générer – automatiquement et librement (ou à très bas prix) – des textes qu'ils paieraient autrement des écrivains pour créer. »

Les scribes sont mécontents du fait que non seulement OpenAI a formé ses modèles sur leur travail sans autorisation, mais que les systèmes d'IA copient injustement leurs écrits lorsqu'ils répondent aux demandes des gens, du moins c'est ce qu'on prétend.

La plainte souligne que ChatGPT a été incité avec succès à créer un « aperçu détaillé d'un livre préquel à Game Of Thrones … en utilisant les mêmes personnages des livres existants de Martin dans la série A Song of Ice and Fire de.» Des résultats similaires ont été possibles pour les autres auteurs qui ont rejoint la poursuite.

La capacité de ChatGPT à le faire est problématique, étant donné que les auteurs ont déclaré qu'ils n'avaient pas autorisé OpenAI à accéder à leurs travaux comme il semble l'avoir fait. Les auteurs estiment que lorsque le laboratoire d'IA a introduit son travail dans le modèle pendant la formation, cela équivalait à une copie non autorisée et que les modèles GPT produisaient des dérivés illégaux d'œuvres protégées par le droit d'auteur.

« Au cœur de ces algorithmes se trouve le vol systématique à grande échelle », affirment les documents du procès.

La plainte indique qu'OpenAI a admis avoir utilisé des ensembles de données nommés « Books1 » et « Books2 » pour former ses grands modèles de langage, mais n'a pas divulgué leur contenu. Les plaignants soupçonnent que des livres pirates se sont introduits dans les données de formation OpenAI.

« La croissance en puissance et en sophistication de GPT-3 à GPT-4 suggère une croissance corrélative de la taille des ensembles de données de « formation », ce qui laisse penser qu'une ou plusieurs très grandes sources d'ebooks piratés évoquées ci-dessus doivent avoir été utilisées pour « former "GPT-4", fait valoir la plainte, ajoutant "Il n'y a aucun autre moyen pour OpenAI d'obtenir le volume de livres requis pour" former "un LLM puissant comme GPT-4."

En fait, la plainte mentionne une autre manière : payer pour le contenu utilisé pour former ChatGPT. Mais la poursuite allègue qu'OpenAI n'a jamais pensé à le faire et cite le témoignage du PDG Sam Altman au Congrès selon lequel il croit au droit d'auteur et a payé certaines données de formation.

"Pour les écrivains de fiction, l'utilisation non autorisée de leur travail par OpenAI constitue un vol d'identité à grande échelle", a déclaré Mary Rasenberger, PDG de Authors Guild.

« Les auteurs de fiction créent des mondes entièrement nouveaux à partir de leur imagination – ils créent les lieux, les gens et les événements de leurs histoires », a-t-elle ajouté, avant de déplorer : « Les gens distribuent déjà du contenu généré par des versions de GPT qui imitent ou utilisent des auteurs originaux. " personnages et histoires. Les entreprises vendent des invites qui vous permettent « d'entrer dans le monde » des livres d'un auteur. Il s’agit de violations flagrantes des droits de propriété intellectuelle des créateurs originaux.

Les plaignants veulent « des dommages-intérêts pour l’opportunité perdue d’obtenir une licence sur leurs œuvres et pour l’usurpation du marché que les défendeurs [OpenAI] ont permis en faisant des plaignants des complices involontaires de leur propre remplacement ; et une injonction permanente pour empêcher que ces préjudices ne se reproduisent.

Le registre a demandé des commentaires à OpenAI et mettra à jour cette histoire si nous recevons une réponse substantielle. ®

Horodatage:

Plus de Le registre