Ο νικητής του βραβείου Πούλιτζερ και άλλοι μήνυσαν το OpenAI

Ο νικητής του βραβείου Πούλιτζερ και άλλοι μήνυσαν το OpenAI

Ο βραβευμένος με Πούλιτζερ αμερικανός μυθιστοριογράφος Μάικλ Τσαμπόν και αρκετοί άλλοι συγγραφείς κατέθεσαν μια πρόταση ομαδικής αγωγής κατηγορώντας το OpenAI για παραβίαση πνευματικών δικαιωμάτων επειδή φέρεται να ενσωμάτωσε το έργο τους στα σύνολα δεδομένων που χρησιμοποιούνται για την εκπαίδευση των μοντέλων πίσω από το ChatGPT.

Η μήνυση ισχυρίζεται ότι το OpenAI «έκανε ένα ευρύ δίχτυ στο διαδίκτυο» για να συλλάβει το πιο ολοκληρωμένο σύνολο περιεχομένου που είναι διαθέσιμο για την καλύτερη εκπαίδευση των μοντέλων GPT του, που φέρεται ότι το οδηγεί «αναγκαστικά» να καταγράφει, να κατεβάζει και να προστατεύεται από πνευματικά δικαιώματα γραπτά έργα, θεατρικά έργα και άρθρα."

Ένα από τα πιο ενδιαφέροντα μέρη της αγωγής είναι ένας ισχυρισμός σχετικά με το πώς οι συγγραφείς πιστεύουν ότι η επιχείρηση τεχνητής νοημοσύνης πήρε στα χέρια της «δύο κορμούς βιβλίων που βασίζονται στο Διαδίκτυο», τα οποία σημειώνει ότι το OpenAI αναφέρεται απλώς ως «Books1» και «Books2». Η κατάθεση ισχυρίζεται ότι στο έγγραφο του Ιουλίου 2020 που παρουσιάζει το GPT-3, "Τα μοντέλα γλώσσας είναι λίγοι μαθητές", το OpenAI αποκάλυψε ότι εκτός από τα σύνολα δεδομένων ιστοσελίδων "Common Crawl" και "WebText", "16 τοις εκατό του συνόλου δεδομένων εκπαίδευσης GPT3 προήλθε από… «Βιβλία1» και «Βιβλία2».

Η μήνυση των συγγραφέων συνεχίζει να ισχυρίζεται ότι υπάρχουν μόνο λίγα μέρη στο δημόσιο Διαδίκτυο που περιέχουν τόσο πολύ υλικό, υποστηρίζοντας ότι το σύνολο δεδομένων Books1 του OpenAI «βασίζεται είτε στο Standardized Project Gutenberg Corpus είτε στο Project Gutenberg» και κατηγορεί την AI biz για προμήθεια Books2 από:

Διαβόητες ιστοσελίδες «σκιώδης βιβλιοθήκης», όπως η Library Genesis («LibGen»), η Z-Library, η Sci-Hub και η Bibliotik, οι οποίες φιλοξενούν τεράστιες συλλογές πειρατικών βιβλίων, ερευνητικών εργασιών και άλλου υλικού που βασίζεται σε κείμενο. Το υλικό που συγκεντρώθηκε από αυτούς τους ιστότοπους ήταν επίσης διαθέσιμο χύμα μέσω συστημάτων torrent.

Στο κοστούμι περιλαμβάνεται επίσης ο βραβευμένος με Tony and Grammy David Henry Hwang, ο θεατρικός συγγραφέας και σεναριογράφος πίσω από Μ. Πεταλούδα, Τσίνγκλις, Κιτρινοπρόσωπο, να Ο Χορός και ο Σιδηρόδρομος; Νικητής Peabody και Έρωτας και άλλες Αδύνατες Επιδιώξεις συγγραφέας Ayelet Waldman; Γυναίκες που θάψαμε συγγραφέας Rachel Louise Snyder. και Ποιος είναι ο πλούσιος; γραφέας Μάθιου Κλαμ.

Οι συγγραφείς ισχυρίζονται ότι «όταν ζητηθεί από το ChatGPT, δημιουργεί όχι μόνο περιλήψεις, αλλά και εις βάθος αναλύσεις των θεμάτων που υπάρχουν στα έργα των Εναγόντων που προστατεύονται από πνευματικά δικαιώματα», οι συγγραφείς πιστεύουν ότι «το υποκείμενο μοντέλο GPT εκπαιδεύτηκε χρησιμοποιώντας [τα] έργα των εναγόντων .»

Οι δικηγόροι των συγγραφέων υποστηρίζουν επίσης ότι όταν τους ζητήθηκε να γράψουν μια παράγραφο στο ύφος του The Amazing Adventures of Kavalier & Clay, το βιβλίο που χάρισε στον Αμερικανό μυθιστοριογράφο Chabon το Pulitzer του, το ChatGPT δημιούργησε ένα απόσπασμα που μιμείται το στυλ γραφής του και περιλαμβάνει αναφορές στους χαρακτήρες που ασχολούνται με «το βάρος του κόσμου σε πόλεμο».

Στιγμιότυπο από την καταγγελία, έκθεμα Α

Στιγμιότυπο οθόνης από την καταγγελία, έκθεμα Α (κάντε κλικ για μεγέθυνση)

Η κοστούμι [PDF] κατατέθηκε στο ομοσπονδιακό δικαστήριο της Καλιφόρνια στα τέλη της περασμένης εβδομάδας και χθες ανατέθηκε στον δικαστή του San Francisco Magistrate Peter H. Kang.

Το OpenAI αντιμετωπίζει πολλές αγωγές σχετικά με τα πνευματικά δικαιώματα – συμπεριλαμβανομένων δύο στο Σαν Φρανσίσκο που κατατέθηκαν από τους μυθιστοριογράφους Paul Tremblay και Mona Awad και, χωριστά, την κωμική Sarah Silverman και τους μυθιστοριογράφους Christopher Golden και Richard Kadrey. Οι δικηγόροι της υποστήριξαν σε αυτές τις περιπτώσεις ότι η τεχνητή νοημοσύνη δεν έχει παραβιάσει τους νόμους περί πνευματικών δικαιωμάτων, υποστηρίζοντας ότι τα LLM του ChatGPT προστατεύονται σύμφωνα με το δόγμα των ΗΠΑ της «δίκαιης χρήσης». Το επιχείρημά τους είναι ότι ο τρόπος που η επιχείρηση χρησιμοποιεί το κείμενο συμμορφώνεται με τις Η.Π.Α νόμος περί πνευματικών δικαιωμάτων, το οποίο επιτρέπει μια εξαίρεση δίκαιης χρήσης για τις λεγόμενες «μεταμορφωτικές χρήσεις» του έργου – ένα remix του πρωτότυπου που εξυπηρετεί διαφορετικό σκοπό ή κοινό.

Το Γραφείο Πνευματικών Δικαιωμάτων των ΗΠΑ είναι τη στιγμή αναζητώντας σχόλια σχετικά με μια μελέτη του νόμου περί πνευματικών δικαιωμάτων και ζητημάτων πολιτικής που εγείρονται από συστήματα τεχνητής νοημοσύνης.

Η Defense for OpenAI δεν έχει ακόμη καταθέσει απάντηση στην καταγγελία Chabon. Ζητήσαμε σχόλιο από το OpenAI.

Οι ισχυρισμοί στην υπόθεση περιλαμβάνουν άμεση και αντικαταστατική παραβίαση πνευματικών δικαιωμάτων, παράνομη αφαίρεση πληροφοριών διαχείρισης πνευματικών δικαιωμάτων, αθέμιτο ανταγωνισμό και αδικαιολόγητο πλουτισμό. Ζητούν ασφαλιστικά μέτρα κατά της παραβίασης των πνευματικών τους δικαιωμάτων καθώς και απροσδιόριστων ζημιών.

Το αφεντικό του OpenAI, Sam Altman, την περασμένη εβδομάδα σημείωσε το πρώτο γκολ στην Ινδονησία χρυσή θεώρηση – που σημαίνει ότι μπορεί τώρα να ζήσει στο αρχιπελαγικό έθνος για έως και 10 χρόνια – σε αναγνώριση της δυνατότητάς του να «δημιουργήσει εισερχόμενες επενδύσεις». ®

Σφραγίδα ώρας:

Περισσότερα από Το μητρώο