Bill würde verlangen, dass KIs urheberrechtlich geschützte Trainingsdaten offenlegen

Bill würde verlangen, dass KIs urheberrechtlich geschützte Trainingsdaten offenlegen

Bill würde verlangen, dass KIs urheberrechtlich geschützte Trainingsdaten PlatoBlockchain Data Intelligence offenlegen. Vertikale Suche. Ai.

Ein im US-Repräsentantenhaus eingebrachter Gesetzentwurf würde von den trainierenden KI-Modellen verlangen, alle verwendeten urheberrechtlich geschützten Werke offenzulegen, und er würde rückwirkend gelten.

Der gestern vom Kongressabgeordneten Adam Schiff (D-CA) vorgeschlagene Generative AI Copyright Disclosure Act [PDF] könnte für KI-Unternehmen, die urheberrechtlich geschützte Werke verwenden, um große Sprachmodelle und andere Formen maschineller Lernsysteme zu trainieren, große Kopfschmerzen bereiten.

Der Gesetzentwurf sieht vor, dass „eine Person, die einen Trainingsdatensatz erstellt … der beim Aufbau eines generativen KI-Systems verwendet wird“, eine Mitteilung an das Urheberrechtsregister mit einer „ausreichend detaillierten Zusammenfassung“ aller urheberrechtlich geschützten Werke im Trainingsdatensatz einreicht. Änderungen am Datensatz würden ebenfalls eine Übermittlung erfordern und in beiden Fällen müsste eine URL für den Trainingsdatensatz bereitgestellt und in eine öffentliche Datenbank gestellt werden. 

Auch die Mitteilung müsste fristgerecht eingereicht werden – das Urheberrechtsamt müsste innerhalb von 30 Tagen nach Veröffentlichung eines auf einem solchen Datensatz trainierten KI-Systems eine Liste der Werke erhalten. KI-Systeme, die vor der Verabschiedung des Gesetzentwurfs auf urheberrechtlich geschützte Werke trainiert wurden, hätten ebenfalls 30 Tage Zeit, um eine Liste einzureichen. 

Der Gesetzentwurf sieht eine etwas nebulöse Strafe von mindestens 5,000 US-Dollar für die Nichtübermittlung einer Liste an das Urheberrechtsregister vor.

„KI hat das disruptive Potenzial, unsere Wirtschaft, unser politisches System und unser tägliches Leben zu verändern“, sagte Schiff sagte in einer vorgefertigten Erklärung. „Wir müssen das immense Potenzial der KI mit der entscheidenden Notwendigkeit ethischer Richtlinien und Schutzmaßnahmen in Einklang bringen.“ 

Schiff, der dieses Jahr für einen Senatssitz in Kalifornien kandidiert, sagte, bei dem Gesetzentwurf gehe es darum, „die Kreativität im Zeitalter der KI zu respektieren und technologischen Fortschritt mit Fairness zu verbinden“. 

Eine Reihe kreativer Branchengruppen haben die Gesetzgebung befürwortet, darunter die Recording Industry Association of America, die Screen Actors Guild und sowohl die Ost- als auch die Westabteilung der Writers Guild of America.

„Dieser Gesetzentwurf ist ein wichtiger erster Schritt zur Bekämpfung der beispiellosen und unbefugten Nutzung urheberrechtlich geschützter Materialien zum Trainieren generativer KI-Systeme“, sagte WGA-West-Präsidentin Meredith Stiehm. „Mehr Transparenz und Leitplanken rund um die KI sind notwendig, um Autoren und andere Kreative zu schützen.“

KIs, die auf populäre Schriftsteller, Künstler und Musiker trainiert wurden, können dies tun erbrechen Teilweise Nachahmungen ihrer Werke – eine Tatsache, die zuletzt den Zorn Hunderter Musiker auf sich zog.

Eine Gruppe namens The Artists Rights Alliance hat eine gegründet Petition Anfang dieses Monats forderte die Regierung, die Verwendung urheberrechtlich geschützter Musik zum Trainieren von KIs zu beenden, und bezeichnete dies als „einen Wettlauf nach unten, der den Wert unserer Arbeit mindern und verhindern wird, dass wir angemessen entlohnt werden“ sowie einen Angriff auf die Kreativität. 

Andere kreative Typen, Schriftsteller und Künstler Unter ihnen haben sich allerdings gegen die Verwendung ihrer Werke zur Ausbildung von KIs ausgesprochen und Klagen eingereicht vergeblich, um zu verhindern, dass KI auf ihre Inhalte trainiert wird. 

Es ist nicht sofort klar, wie KI-Firmen auf den Gesetzentwurf reagieren werden – wir haben nachgefragt und werden diese Geschichte aktualisieren, wenn wir etwas hören – aber wir stellen fest, dass OpenAI dies mitgeteilt hat Es ist unmöglich, eine gute KI zu trainieren Modell, ohne sich auf urheberrechtlich geschützte Inhalte zu verlassen.

Diejenigen, die sich auf urheberrechtlich geschütztes Material verlassen, sind am Ende möglicherweise unzufrieden damit, offenlegen zu müssen, worauf sie ihre Modelle trainiert haben. Der Gesetzentwurf verbietet jedoch nicht die Verwendung urheberrechtlich geschützter Werke zum Trainieren von KI – die Gesetzgebung schreibt lediglich vor, dass sie öffentlich bekannt gemacht werden. ®

Zeitstempel:

Mehr von Das Register