Proyecto de ley exigiría que las IA revelen datos de entrenamiento protegidos por derechos de autor

Proyecto de ley exigiría que las IA revelen datos de entrenamiento protegidos por derechos de autor

Bill exigiría que las IA revelen datos de entrenamiento protegidos por derechos de autor PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Un proyecto de ley presentado en la Cámara de Representantes de Estados Unidos exigiría que quienes entrenen modelos de IA revelen todas y cada una de las obras protegidas por derechos de autor utilizadas, y se aplicaría con carácter retroactivo.

Propuesta ayer por el congresista Adam Schiff (D-CA), la Ley de divulgación de derechos de autor de IA generativa [(PDF)] podría resultar un gran dolor de cabeza para las empresas de inteligencia artificial que utilizan trabajos protegidos por derechos de autor para entrenar grandes modelos de lenguaje y otras formas de sistemas de aprendizaje automático.

El proyecto de ley requeriría que “una persona que crea un conjunto de datos de entrenamiento… que se utiliza en la construcción de un sistema de IA generativa” presente un aviso al Registro de Derechos de Autor con un “resumen suficientemente detallado” de cualquier trabajo protegido por derechos de autor en el conjunto de datos de entrenamiento. Las modificaciones al conjunto de datos también requerirían un envío y en ambos casos se tendría que proporcionar una URL para el conjunto de datos de entrenamiento y colocarla en una base de datos pública. 

La notificación también tendría que presentarse de manera oportuna: la oficina de derechos de autor tendría que recibir una lista de obras dentro de los 30 días posteriores a que un sistema de inteligencia artificial entrenado en dicho conjunto de datos se hiciera público. Los sistemas de inteligencia artificial entrenados en obras protegidas por derechos de autor antes de la aprobación del proyecto de ley también tendrían 30 días para obtener una lista. 

El proyecto de ley incluye una multa por incumplimiento un tanto nebulosa de al menos 5,000 dólares por no enviar una lista al Registro de Derechos de Autor.

"La IA tiene el potencial disruptivo de cambiar nuestra economía, nuestro sistema político y nuestra vida cotidiana", Schiff dijo en una declaración enlatada. "Debemos equilibrar el inmenso potencial de la IA con la necesidad crucial de directrices y protecciones éticas". 

Schiff, que se postula para un escaño en el Senado de California este año, dijo que el proyecto de ley “trata de respetar la creatividad en la era de la IA y combinar el progreso tecnológico con la justicia”. 

Varios grupos comerciales creativos han respaldado la legislación, incluida la Recording Industry Association of America, el Screen Actors Guild y las divisiones Este y Oeste del Writers Guild of America.

"Este proyecto de ley es un primer paso importante para abordar el uso no autorizado y sin precedentes de materiales protegidos por derechos de autor para entrenar sistemas generativos de IA", dijo la presidenta de WGA-West, Meredith Stiehm. "Es necesaria una mayor transparencia y barreras de seguridad en torno a la IA para proteger a los escritores y otros creadores".

Las IA entrenadas con escritores, artistas y músicos populares pueden regurgitar imitaciones parciales de sus obras, un hecho que recientemente provocó la ira de cientos de músicos.

Un grupo llamado The Artists Rights Alliance lanzó una petición a principios de este mes para poner fin al uso de música protegida por derechos de autor para entrenar IA, calificándola de “una carrera hacia el fondo que degradará el valor de nuestro trabajo y evitará que recibamos una compensación justa”, así como un ataque a la creatividad. 

Otros tipos creativos, escritores y artistas entre ellos, han criticado el uso de sus obras para entrenar IA y han presentado demandas, aunque sin éxito, para evitar que la IA se entrene en su contenido. 

No está claro de inmediato cómo reaccionarán las empresas de IA al proyecto de ley (hemos preguntado y actualizaremos esta historia si recibimos respuesta), pero observamos que OpenAI ha dicho que actualmente imposible entrenar una buena IA modelo sin depender de contenido protegido por derechos de autor.

Aquellos que dependen de materiales protegidos por derechos de autor pueden terminar descontentos por tener que revelar en qué han entrenado a sus modelos. Pero el proyecto de ley no hace nada para prohibir el uso de obras protegidas por derechos de autor para entrenar la IA: la legislación sólo exige que estén en el registro público. ®

Sello de tiempo:

Mas de El registro