Le projet de loi obligerait les IA à révéler des données d'entraînement protégées par le droit d'auteur

Le projet de loi obligerait les IA à révéler des données d'entraînement protégées par le droit d'auteur

Le projet de loi exigerait que les IA révèlent les données de formation protégées par le droit d'auteur PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Un projet de loi présenté à la Chambre des représentants des États-Unis exigerait que les modèles d'IA qui forment des modèles d'IA divulguent toutes les œuvres protégées par le droit d'auteur utilisées, et s'appliquerait de manière rétroactive.

Proposée hier par le membre du Congrès Adam Schiff (D-CA), la Generative AI Copyright Disclosure Act [PDF] pourrait s'avérer un énorme casse-tête pour les entreprises d'IA qui utilisent des œuvres protégées par le droit d'auteur pour former de grands modèles de langage et d'autres formes de systèmes d'apprentissage automatique.

Le projet de loi exigerait « qu’une personne qui crée un ensemble de données de formation… utilisé dans la construction d’un système d’IA générative » soumette un avis au Registre des droits d’auteur avec un « résumé suffisamment détaillé » de toutes les œuvres protégées par le droit d’auteur dans l’ensemble de données de formation. Les modifications apportées à l'ensemble de données nécessiteraient également une soumission et dans les deux cas, une URL pour l'ensemble de données de formation devrait être fournie et placée dans une base de données publique. 

L’avis devrait également être déposé en temps opportun – le bureau du droit d’auteur devrait recevoir une liste des œuvres dans les 30 jours suivant la publication d’un système d’IA formé sur un tel ensemble de données. Les systèmes d’IA formés sur les œuvres protégées par le droit d’auteur avant l’adoption du projet de loi disposeraient également de 30 jours pour obtenir une liste. 

Le projet de loi comprend une pénalité de non-conformité quelque peu nébuleuse d'au moins 5,000 XNUMX $ pour défaut d'envoi d'une liste au Registre des droits d'auteur.

"L'IA a le potentiel perturbateur de changer notre économie, notre système politique et notre vie quotidienne", Schiff a affirmé Valérie Plante. dans une déclaration prédéfinie. « Nous devons équilibrer l’immense potentiel de l’IA avec le besoin crucial de lignes directrices et de protections éthiques. » 

Schiff, qui se présente cette année au Sénat de Californie, a déclaré que le projet de loi « vise à respecter la créativité à l’ère de l’IA et à allier progrès technologique et équité ». 

Un certain nombre de groupes professionnels créatifs ont approuvé la législation, notamment la Recording Industry Association of America, la Screen Actors Guild et les divisions Est et Ouest de la Writers Guild of America.

"Ce projet de loi est une première étape importante dans la lutte contre l'utilisation sans précédent et non autorisée de matériels protégés par le droit d'auteur pour former des systèmes d'IA générative", a déclaré la présidente de la WGA-West, Meredith Stiehm. « Une plus grande transparence et des garde-fous autour de l’IA sont nécessaires pour protéger les écrivains et autres créateurs. »

Les IA formées sur des écrivains, artistes et musiciens populaires peuvent régurgiter des imitations partielles de leurs œuvres – un fait qui a récemment suscité la colère de centaines de musiciens.

Un groupe appelé The Artists Rights Alliance a lancé une pétition plus tôt ce mois-ci, pour mettre fin à l’utilisation de musique protégée par le droit d’auteur pour former des IA, la qualifiant de « course vers le bas qui dégradera la valeur de notre travail et nous empêchera d’être équitablement rémunérés », ainsi que d’attaque contre la créativité. 

Autres types de créations, écrivains et les artistes parmi eux, se sont élevés contre l'utilisation de leurs travaux pour entraîner des IA et ont intenté des poursuites, bien que sans succès, pour empêcher l'IA d'être formée sur leur contenu. 

On ne sait pas encore clairement comment les entreprises d'IA réagiront au projet de loi – nous l'avons demandé et mettrons à jour cette histoire si nous recevons une réponse – mais nous notons qu'OpenAI a déclaré qu'il était actuellement en train de le faire. impossible de former une bonne IA modèle sans s’appuyer sur du contenu protégé par le droit d’auteur.

Ceux qui s'appuient sur du matériel protégé par le droit d'auteur pourraient se retrouver mécontents de devoir divulguer les éléments sur lesquels ils ont formé leurs modèles. Mais le projet de loi ne fait rien pour interdire l’utilisation d’œuvres protégées par le droit d’auteur pour former l’IA – la législation exige simplement que cela soit rendu public. ®

Horodatage:

Plus de Le registre