Bill zou AI's verplichten om auteursrechtelijk beschermde trainingsgegevens vrij te geven

Bill zou AI's verplichten om auteursrechtelijk beschermde trainingsgegevens vrij te geven

Bill zou AI's verplichten om auteursrechtelijk beschermde trainingsgegevens PlatoBlockchain Data Intelligence te onthullen. Verticaal zoeken. Ai.

Een wetsvoorstel dat in het Amerikaanse Huis van Afgevaardigden is ingediend, zou vereisen dat degenen die AI-modellen trainen, alle gebruikte auteursrechtelijk beschermde werken openbaar moeten maken, en het zou met terugwerkende kracht van toepassing zijn.

Gisteren voorgesteld door Congreslid Adam Schiff (D-CA), de Genative AI Copyright Disclosure Act [PDF] zou een enorme hoofdpijn kunnen opleveren voor AI-bedrijven die auteursrechtelijk beschermd werk gebruiken om grote taalmodellen en andere vormen van machine learning-systemen te trainen.

Het wetsvoorstel zou vereisen dat “een persoon die een trainingsdataset creëert… die wordt gebruikt bij het bouwen van een generatief AI-systeem,” een kennisgeving indient bij het Register of Copyrights met een “voldoende gedetailleerde samenvatting” van alle auteursrechtelijk beschermde werken in de trainingsdataset. Voor wijzigingen aan de dataset zou ook een indiening nodig zijn en in beide gevallen zou een URL voor de trainingsdataset moeten worden opgegeven en in een openbare database moeten worden geplaatst. 

De kennisgeving zou ook tijdig moeten worden ingediend: het Auteursrechtenbureau zou een lijst met werken moeten krijgen binnen 30 dagen nadat een AI-systeem dat is getraind op een dergelijke dataset openbaar is gemaakt. AI-systemen die vóór de goedkeuring van het wetsvoorstel waren getraind op auteursrechtelijk beschermde werken, zouden allemaal 30 dagen de tijd hebben om een ​​lijst binnen te krijgen. 

Het wetsvoorstel omvat een enigszins vage boete voor niet-naleving van ten minste $ 5,000 voor het niet verzenden van een lijst naar het Register of Copyrights.

“AI heeft het ontwrichtende potentieel om onze economie, ons politieke systeem en ons dagelijks leven te veranderen”, aldus Schiff zei in een ingeblikte verklaring. “We moeten het immense potentieel van AI in evenwicht brengen met de cruciale behoefte aan ethische richtlijnen en bescherming.” 

Schiff, die zich dit jaar kandidaat stelt voor een zetel in de Senaat in Californië, zei dat het wetsvoorstel “gaat over het respecteren van creativiteit in het tijdperk van AI en het combineren van technologische vooruitgang met eerlijkheid.” 

Een aantal creatieve handelsgroepen hebben de wetgeving onderschreven, waaronder de Recording Industry Association of America, de Screen Actors Guild en zowel de Oost- als de West-divisie van de Writers Guild of America.

“Dit wetsvoorstel is een belangrijke eerste stap in de aanpak van het ongekende en ongeoorloofde gebruik van auteursrechtelijk beschermd materiaal om generatieve AI-systemen te trainen”, aldus WGA-West-president Meredith Stiehm. “Grotere transparantie en vangrails rond AI zijn nodig om schrijvers en andere makers te beschermen.”

AI's die zijn getraind op populaire schrijvers, artiesten en muzikanten kunnen dat wel braken gedeeltelijke imitaties van hun werken – een feit dat onlangs de woede van honderden muzikanten opwekte.

Een groep genaamd The Artists Rights Alliance lanceerde een petitie eerder deze maand om een ​​einde te maken aan het gebruik van auteursrechtelijk beschermde muziek om AI’s te trainen, en noemde het “een race naar de bodem die de waarde van ons werk zal degraderen en zal voorkomen dat we eerlijk worden gecompenseerd”, evenals een aanval op de creativiteit. 

Andere advertentietypen, schrijvers en kunstenaars onder hen hebben zich uitgesproken tegen het gebruik van hun werken om AI’s te trainen en hebben rechtszaken aangespannen zonder succes, om te voorkomen dat AI wordt getraind op hun inhoud. 

Het is niet meteen duidelijk hoe AI-bedrijven op het wetsvoorstel zullen reageren – we hebben dit gevraagd en zullen dit verhaal bijwerken als we iets horen – maar we merken op dat OpenAI heeft gezegd dat het momenteel onmogelijk om een ​​goede AI te trainen model zonder te vertrouwen op auteursrechtelijk beschermde inhoud.

Degenen die afhankelijk zijn van auteursrechtelijk beschermd materiaal, kunnen er uiteindelijk niet blij mee zijn dat ze moeten onthullen waar ze hun modellen op hebben getraind. Maar het wetsvoorstel verbiedt op geen enkele manier het gebruik van auteursrechtelijk beschermde werken om AI te trainen – de wetgeving vereist alleen dat het openbaar wordt gemaakt. ®

Tijdstempel:

Meer van Het register