Los gigantes tecnológicos eluden las preguntas sobre las normas de derechos de autor del LLM

Los gigantes tecnológicos eluden las preguntas sobre las normas de derechos de autor del LLM

Los gigantes tecnológicos esquivan las preguntas sobre las reglas de derechos de autor del LLM PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Esta semana en el Parlamento del Reino Unido, Microsoft y Meta eludieron la pregunta de si se debería pagar a los creadores cuando su material protegido por derechos de autor se utiliza para entrenar grandes modelos de lenguaje.

Los titanes tecnológicos, con ingresos combinados que superaban con creces los 200 millones de dólares, estaban siendo A la parrilla por el Comité Digital y de Comunicaciones de la Cámara de los Lores cuando surgió la cuestión de los derechos de autor.

En septiembre, el Authors' Guild, una asociación comercial de escritores publicados, y 17 autores presentó una demanda colectiva en los EE. UU. por el uso de su material por parte de OpenAI para crear sus servicios basados ​​​​en LLM.

El director ejecutivo de OpenAI, Sam Altman, ha dicho desde entonces que la compañía cubriría los costos legales de sus clientes por demandas por infracción de derechos de autor en lugar de eliminar el material de sus conjuntos de capacitación.

Microsoft tiene será invertido 13 mil millones de dólares en OpenAI. Tiene una asociación ampliada con el desarrollador de aprendizaje automático, impulsando sus cargas de trabajo en la plataforma en la nube Azure y utilizando sus modelos para ejecutar el asistente automatizado Copilot.

En declaraciones ayer ante los Lores, Owen Larter, director de políticas públicas de la Oficina de IA Responsable de Microsoft, dijo: “Es importante apreciar lo que es un modelo de lenguaje amplio. Es un modelo grande entrenado con datos de texto, que aprende las asociaciones entre diferentes ideas. No necesariamente se trata de succionar algo desde abajo”.

Dijo que debería haber un "marco" para brindar cierta protección al material protegido por derechos de autor y que Microsoft asumiría la responsabilidad por cualquier infracción por parte de sus sistemas basados ​​en LLM. Pero también dijo que Microsoft apoya la reciente Informe de cenefa en la ley de IA “pro-innovación” en el Reino Unido que aboga por excepciones de texto y datos en los modelos de entrenamiento.

Pero Donald Michael, Lord Foster de Bath, presionó a Larter sobre si aceptaría que si una empresa utiliza material protegido por derechos de autor para crear un LLM con fines de lucro, el propietario de los derechos de autor debería recibir un reembolso.

El director de Microsoft dijo: "Es realmente importante comprender que es necesario entrenar estos grandes modelos de lenguaje en grandes conjuntos de datos si queremos lograr que funcionen de manera efectiva, si queremos permitir que estén seguros y protegidos... También existen algunos problemas de competencia [para garantizar] que la capacitación de modelos grandes esté disponible para todos. Si se avanza demasiado por un camino en el que es muy difícil obtener datos para entrenar modelos, entonces, de repente, la capacidad de hacerlo sólo será dominio exclusivo de empresas muy grandes”.

El litigio ya está en marcha abordar cómo entrenar conjuntos de datos Libros1, Books2 y Books3, que efectivamente piratean material protegido por derechos de autor, se han utilizado para ayudar a crear LLM populares.

Meta está detrás del Llama 2 LLM, que escala hasta 70 mil millones de parámetros. El gigante de las redes sociales ha promovido el modelo como de código abierto, aunque los puristas del software libre señalan algunas salvedades en su enfoque.

En declaraciones a los Lores, Rob Sherman, vicepresidente y director adjunto de políticas de privacidad de Meta, dijo que la empresa cumpliría con la ley.

Pero añadió que “mantener un amplio acceso a la información en Internet y a la información, incluso para su uso en innovaciones como ésta, es muy importante. Apoyo que se dé a los titulares de derechos la capacidad de gestionar cómo se utiliza su información.

"Soy un poco cauteloso ante la idea de obligar a las empresas que están desarrollando IA a celebrar acuerdos personalizados con titulares de derechos individuales o a pagar por contenido que no tiene valor económico para ellos".

La semana pasada, Dan Conway, director ejecutivo de la Asociación de Editores del Reino Unido, dijo al comité que los grandes modelos lingüísticos estaban infringiendo contenidos protegidos por derechos de autor en una “escala absolutamente masiva”.

"Lo sabemos en la industria editorial gracias a la base de datos Books3, que enumera 120,000 títulos de libros pirateados, que sabemos que han sido ingeridos por grandes modelos lingüísticos", dijo. “Sabemos que el contenido está siendo absorbido a una escala absolutamente masiva por grandes modelos lingüísticos. Los LLM infringen los derechos de autor en múltiples partes del proceso en términos de cuándo recopilan esta información, cómo la almacenan y cómo la manejan. La ley de derechos de autor se está infringiendo a gran escala”.

En la misma audiencia, la Dra. Hayleigh Bosher, profesora de derecho de propiedad intelectual en la Universidad Brunel de Londres, dijo que no representaba a empresas de tecnología ni a creadores de contenido y ofreció una perspectiva neutral.

“El principio de cuándo se necesita una licencia y cuándo no es claro”, dijo, “y hacer una reproducción de una obra protegida por derechos de autor sin permiso requeriría una licencia o sería una infracción. Eso es lo que hace la IA en diferentes pasos del proceso: la ingesta, la ejecución del programa y, potencialmente, incluso la salida.

“Algunos desarrolladores de tecnología e inteligencia artificial defienden una interpretación diferente de la ley. No represento a ninguno de esos lados. Soy un experto en derechos de autor y, desde mi posición, al comprender lo que se supone que deben lograr los derechos de autor y cómo lo logran, se necesitaría una licencia para esa actividad”. ®

Sello de tiempo:

Mas de El registro