Pulitzer-Preisträger und andere verklagen OpenAI

Pulitzer-Preisträger und andere verklagen OpenAI

Der mit dem Pulitzer-Preis ausgezeichnete US-Romanautor Michael Chabon und mehrere andere Autoren haben eine Sammelklage eingereicht, in der sie OpenAI Urheberrechtsverletzungen vorwerfen, weil sie angeblich ihre Arbeit in die Datensätze übernommen haben, die zum Trainieren der Modelle hinter ChatGPT verwendet werden.

In der Klage wird behauptet, dass OpenAI „ein weites Netz über das Internet ausbreitet“, um den umfassendsten verfügbaren Inhaltssatz zu erfassen, um seine GPT-Modelle besser zu trainieren, was angeblich „notwendigerweise“ dazu führt, „urheberrechtlich geschützte schriftliche Werke, Theaterstücke usw. zu erfassen, herunterzuladen und zu kopieren.“ Artikel."

Einer der interessanteren Teile der Klage ist eine Behauptung darüber, wie die Autoren glauben, dass das KI-Unternehmen an „zwei internetbasierte Buchkorpora“ gelangt sei, die OpenAI einfach als „Bücher1“ und „Bücher2“ bezeichnet. In der Einreichung wird behauptet, dass OpenAI in dem Papier vom Juli 2020 zur Einführung von GPT-3 „Language Models are Few-Shot Learners“ offengelegt habe, dass zusätzlich zu den Webseiten-Datensätzen „Common Crawl“ und „WebText“ „16 Prozent des GPT3-Trainingsdatensatzes“ enthalten seien kam von… ‚Books1‘ und ‚Books2‘.“

In der Klage des Autors wird weiter behauptet, dass es nur wenige Stellen im öffentlichen Internet gibt, die so viel Material enthalten, und behauptet, dass der Books1-Datensatz von OpenAI „entweder auf dem Standardized Project Gutenberg Corpus oder dem Project Gutenberg selbst basiert“, und wirft der KI-Branche vor, dies zu tun Bezug von Books2 von:

berüchtigte „Schattenbibliothek“-Websites wie Library Genesis („LibGen“), Z-Library, Sci-Hub und Bibliotik, die riesige Sammlungen von Raubkopien von Büchern, Forschungsarbeiten und anderen textbasierten Materialien hosten. Die von diesen Websites aggregierten Materialien sind auch in großen Mengen über Torrent-Systeme verfügbar.

Zu der Klage gehört auch der Tony- und Grammy-Preisträger David Henry Hwang, der Dramatiker und Drehbuchautor dahinter M. Butterfly, chinglish, Gelbes Gesicht und Der Tanz und die Eisenbahn; Peabody-Gewinner und Liebe und andere unmögliche Ziele Autorin Ayelet Waldman; Frauen, die wir begraben haben Autorin Rachel Louise Snyder; Und Wer ist reich? Schreiber Matthew Klam.

Die Autoren behaupten, dass „wenn ChatGPT dazu aufgefordert wird, nicht nur Zusammenfassungen, sondern auch detaillierte Analysen der in den urheberrechtlich geschützten Werken der Kläger vorhandenen Themen generiert werden“, glauben die Autoren, dass „das zugrunde liegende GPT-Modell anhand der Werke der Kläger trainiert wurde.“ .“

Das behaupten auch die Anwälte der Autoren, wenn sie gebeten werden, einen Absatz im Stil von zu schreiben Die erstaunlichen Abenteuer von Kavalier & Clay, dem Buch, das dem US-amerikanischen Schriftsteller Chabon seinen Pulitzer-Preis einbrachte, erstellte ChatGPT eine Passage, die seinen Schreibstil nachahmte und Verweise auf die Charaktere enthielt, die sich mit „der Last der Welt im Krieg“ befassten.

Screenshot aus der Beschwerde, Beweisstück A

Screenshot der Beschwerde, Beweisstück A (zum Vergrößern anklicken)

Das Anzug [PDF] wurde Ende letzter Woche beim kalifornischen Bundesgericht eingereicht und gestern dem San Francisco Magistrate Judge Peter H. Kang zugewiesen.

OpenAI ist mit mehreren Klagen zum Thema Urheberrecht konfrontiert – darunter zwei in San Francisco, die von den Schriftstellern Paul Tremblay und Mona Awad sowie separat von der Komikerin Sarah Silverman und den Schriftstellern Christopher Golden und Richard Kadrey eingereicht wurden. Seine Anwälte argumentierten in diesen Fällen, dass die KI-Branche nicht gegen Urheberrechte verstoßen habe, und behaupteten, dass die LLMs von ChatGPT durch die US-Doktrin der „fairen Nutzung“ geschützt seien. Ihr Argument ist, dass die Art und Weise, wie das Unternehmen den Text verwendet, den USA entspricht Urheberrecht, die eine Fair-Use-Ausnahme für sogenannte „transformative Nutzungen“ von Werken zulässt – einen Remix des Originals, der einem anderen Zweck oder Publikum dient.

Das US Copyright Office ist zur Zeit Ich suche einen Kommentar zu einer Studie über das Urheberrecht und die politischen Fragen, die durch Systeme der künstlichen Intelligenz aufgeworfen werden.

Die Verteidigung von OpenAI hat noch keine Antwort auf die Chabon-Beschwerde eingereicht. Wir haben OpenAI um einen Kommentar gebeten.

Zu den Vorwürfen in diesem Fall zählen direkte und indirekte Urheberrechtsverletzungen, illegale Entfernung von Urheberrechtsverwaltungsinformationen, unlauterer Wettbewerb und ungerechtfertigte Bereicherung. Sie fordern eine einstweilige Verfügung wegen Verletzung ihrer Urheberrechte sowie Schadensersatz in unbestimmter Höhe.

OpenAI-Chef Sam Altman erzielte letzte Woche Indonesiens ersten Treffer überhaupt goldenes Visum – was bedeutet, dass er nun bis zu 10 Jahre in dem Archipelstaat leben kann – in Anerkennung seines Potenzials, „Inbound-Investitionen zu generieren“. ®

Zeitstempel:

Mehr von Das Register