El ganador del Premio Pulitzer y otros demandan a OpenAI

El ganador del Premio Pulitzer y otros demandan a OpenAI

El novelista estadounidense ganador del Premio Pulitzer Michael Chabon y varios otros escritores han presentado una propuesta de demanda colectiva acusando a OpenAI de infracción de derechos de autor por supuestamente incluir su trabajo en los conjuntos de datos utilizados para entrenar los modelos detrás de ChatGPT.

La demanda afirma que OpenAI "lanzó una amplia red a través de Internet" para capturar el conjunto más completo de contenido disponible para entrenar mejor sus modelos GPT, lo que supuestamente "necesariamente" lo llevó a "capturar, descargar y copiar obras escritas, obras de teatro y obras de teatro protegidas por derechos de autor". artículos."

Una de las partes más interesantes de la demanda es una acusación sobre cómo los autores creen que el negocio de la IA consiguió "dos corpus de libros basados ​​en Internet", a los que OpenAI simplemente se refiere como "Libros1" y "Libros2". La presentación alega que en el documento de julio de 2020 que presenta GPT-3, “Los modelos de lenguaje son aprendices de pocas posibilidades”, OpenAI reveló que, además de los conjuntos de datos de páginas web “Common Crawl” y “WebText”, “el 16 por ciento del conjunto de datos de entrenamiento de GPT3 vino de... 'Libros1' y 'Libros2'”.

La demanda de los escritores continúa alegando que solo hay unos pocos lugares en la Internet pública que contienen tanto material, afirmando que el conjunto de datos Books1 de OpenAI "se basa en el Corpus del Proyecto Gutenberg estandarizado o en el propio Proyecto Gutenberg" y acusa al negocio de la IA de obteniendo Books2 de:

sitios web infames de “bibliotecas en la sombra”, como Library Genesis (“LibGen”), Z-Library, Sci-Hub y Bibliotik, que albergan colecciones masivas de libros pirateados, artículos de investigación y otros materiales basados ​​en texto. Los materiales agregados por estos sitios web también han estado disponibles en masa a través de sistemas torrent.

También se incluye en la demanda al ganador de los premios Tony y Grammy, David Henry Hwang, el dramaturgo y guionista detrás. M. Butterfly, Chinglés, Cara amarillay La danza y el ferrocarril; Ganador de Peabody y Amor y otras búsquedas imposibles la autora Ayelet Waldman; Mujeres que enterramos la autora Rachel Louise Snyder; y ¿Quién es rico? escriba Matthew Klam.

Los escritores alegan que debido a que "cuando se solicita ChatGPT, genera no solo resúmenes, sino también análisis en profundidad de los temas presentes en las obras protegidas por derechos de autor de los demandantes", los escritores creen que "el modelo GPT subyacente fue entrenado utilizando las obras de [los] demandantes". .”

Los abogados de los escritores también afirman que cuando se les pidió que escribieran un párrafo al estilo de Las asombrosas aventuras de Kavalier y Clay, el libro que le valió al novelista estadounidense Chabon su Pulitzer, ChatGPT generó un pasaje que imitaba su estilo de escritura e incluía referencias a los personajes que abordaban "el peso del mundo en guerra".

Captura de pantalla de la denuncia, prueba A

Captura de pantalla de la denuncia, prueba A (haga clic para ampliar)

La traje [PDF] se presentó en el tribunal federal de California a fines de la semana pasada y ayer fue asignado al juez magistrado de San Francisco, Peter H. Kang.

OpenAI se enfrenta a múltiples demandas por derechos de autor, incluidas dos en San Francisco presentadas por los novelistas Paul Tremblay y Mona Awad y, por separado, la comediante Sarah Silverman y los novelistas Christopher Golden y Richard Kadrey. Sus abogados argumentaron en esos casos que el negocio de la IA no ha violado las leyes de derechos de autor, alegando que los LLM de ChatGPT están protegidos bajo la doctrina estadounidense de "uso justo". Su argumento es que la forma en que las empresas utilizan el texto se ajusta a las normas estadounidenses. derecho de autor, que permite una excepción de uso legítimo para los llamados “usos transformadores” de la obra: una remezcla del original que sirve a un propósito o audiencia diferente.

La Oficina de Derechos de Autor de EE. UU. es actualmente buscando comentarios sobre un estudio de la ley de derechos de autor y las cuestiones políticas planteadas por los sistemas de inteligencia artificial.

La defensa de OpenAI aún no ha presentado una respuesta a la denuncia de Chabon. Le hemos pedido comentarios a OpenAI.

Las acusaciones en el caso incluyen infracción directa e indirecta de derechos de autor, eliminación ilegal de información de gestión de derechos de autor, competencia desleal y enriquecimiento injusto. Piden una orden judicial contra la infracción de sus derechos de autor, así como una indemnización por daños y perjuicios no especificados.

El jefe de OpenAI, Sam Altman, anotó la semana pasada el primer gol de Indonesia Golden Visa – lo que significa que ahora puede vivir en la nación archipelágica hasta por 10 años – en reconocimiento a su potencial para “generar inversiones entrantes”. ®

Sello de tiempo:

Mas de El registro