OpenAI: Αδύνατη η εκπαίδευση τεχνητής νοημοσύνης κορυφαίας βαθμίδας και η αποφυγή πνευματικών δικαιωμάτων

OpenAI: Αδύνατη η εκπαίδευση τεχνητής νοημοσύνης κορυφαίας βαθμίδας και η αποφυγή πνευματικών δικαιωμάτων

OpenAI: Αδύνατη η εκπαίδευση της κορυφαίας τεχνητής νοημοσύνης και η αποφυγή πνευματικών δικαιωμάτων PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Το OpenAI είπε ότι θα ήταν «αδύνατο» να δημιουργηθούν νευρωνικά δίκτυα κορυφαίας βαθμίδας που να ανταποκρίνονται στις σημερινές ανάγκες χωρίς τη χρήση του έργου των ανθρώπων που προστατεύονται από πνευματικά δικαιώματα. Το εργαστήριο που υποστηρίζεται από τη Microsoft, το οποίο πιστεύει ότι συλλέγει νόμιμα το εν λόγω περιεχόμενο για την εκπαίδευση των μοντέλων του, είπε ότι η χρήση υλικού δημόσιου τομέα εκτός πνευματικών δικαιωμάτων θα είχε ως αποτέλεσμα λογισμικό τεχνητής νοημοσύνης κατώτερου επιπέδου.

Αυτός ο ισχυρισμός έρχεται σε μια στιγμή που ο κόσμος της μηχανικής μάθησης σπριντ πρώτος στον τοίχο από τούβλα που είναι νόμος περί πνευματικών δικαιωμάτων. Μόλις αυτή την εβδομάδα, μια έκθεση του IEEE κατέληξε στο συμπέρασμα ότι το DALL-E 3 του Midjourney και του OpenAI, δύο από τις σημαντικότερες υπηρεσίες AI για τη μετατροπή των προτροπών κειμένου σε εικόνες, μπορούν να αναδημιουργήσουν σκηνές που προστατεύονται από πνευματικά δικαιώματα από ταινίες και βιντεοπαιχνίδια με βάση τα δεδομένα εκπαίδευσής τους.

Η μελέτη, που συνυπογράφουν ο Gary Marcus, ειδικός και κριτικός τεχνητής νοημοσύνης, και ο Reid Southen, ένας ψηφιακός εικονογράφος, τεκμηριώνουν πολλαπλές περιπτώσεις «λογοκλοπής» στα οποία το OpenAI και το DALL-E 3 αποδίδουν ουσιαστικά παρόμοιες εκδοχές σκηνών από ταινίες, φωτογραφίες διάσημων ηθοποιούς και περιεχόμενο βιντεοπαιχνιδιών.

Οι Marcus και Southen λένε ότι είναι σχεδόν βέβαιο ότι η Midjourney και η OpenAI εκπαίδευσαν τα αντίστοιχα μοντέλα παραγωγής εικόνων AI σε υλικό που προστατεύεται από πνευματικά δικαιώματα.

Το αν αυτό είναι νόμιμο και εάν οι πωλητές τεχνητής νοημοσύνης ή οι πελάτες τους κινδυνεύουν να θεωρηθούν υπεύθυνοι, παραμένει αμφιλεγόμενο ερώτημα. Ωστόσο, τα ευρήματα της έκθεσης μπορεί να ενισχύσουν όσους κάνουν μήνυση της Midjourney και του κατασκευαστή DALL-E OpenAI για παραβίαση πνευματικών δικαιωμάτων.

Οι χρήστες μπορεί να μην γνωρίζουν, όταν παράγουν μια εικόνα, εάν παραβιάζουν

«Τόσο το OpenAI όσο και το Midjourney είναι πλήρως ικανά να παράγουν υλικό που φαίνεται να παραβιάζει πνευματικά δικαιώματα και εμπορικά σήματα», έγραψαν. «Αυτά τα συστήματα δεν ενημερώνουν τους χρήστες όταν το κάνουν. Δεν παρέχουν καμία πληροφορία σχετικά με την προέλευση των εικόνων που παράγουν. Οι χρήστες μπορεί να μην γνωρίζουν, όταν παράγουν μια εικόνα, εάν παραβιάζουν."

Κανένα από τα δύο biz δεν έχει αποκαλύψει πλήρως τα δεδομένα εκπαίδευσης που χρησιμοποιήθηκαν για την κατασκευή των μοντέλων AI.

Δεν είναι μόνο ψηφιακούς καλλιτέχνες προκλητικές εταιρείες τεχνητής νοημοσύνης. Οι New York Times πρόσφατα μήνυσε το OpenAI επειδή το μοντέλο κειμένου του ChatGPT θα βγάζει σχεδόν κατά λέξη αντίγραφα των άρθρων της εφημερίδας με το paywald. Συγγραφείς βιβλίων έχουν υποβάλει παρόμοιες αξιώσεις, όπως και έχουν προγραμματιστές λογισμικού.

Πριν έρευνα έχει υποδείξει ότι το ChatGPT του OpenAI μπορεί να παρακινηθεί για την αναπαραγωγή κειμένου εκπαίδευσης. Και όσοι μηνύουν τη Microsoft και το GitHub υποστηρίζουν ότι το μοντέλο του βοηθού κωδικοποίησης Copilot θα αναπαράγει τον κώδικα λίγο πολύ κατά λέξη.

Ο Southen παρατήρησε ότι το Midjourney χρεώνει πελάτες που δημιουργούν περιεχόμενο παραβίασης και κερδοσκοπούν μέσω εσόδων από συνδρομές. «Οι χρήστες του MJ [Midjourney] δεν χρειάζεται να πουλήσουν τις εικόνες για ενδεχόμενη παραβίαση πνευματικών δικαιωμάτων, η MJ έχει ήδη κέρδη από τη δημιουργία της», παρατήρησε, επαναλαμβάνοντας ένα επιχείρημα που διατυπώθηκε στην έκθεση IEEE.

Το OpenAI χρεώνει επίσης μια συνδρομή και έτσι κερδίζει με τον ίδιο τρόπο. Ούτε το OpenAI και το Midjourney δεν απάντησαν σε αιτήματα για σχολιασμό.

Ωστόσο, το OpenAI τη Δευτέρα δημοσίευσε ένα ανάρτηση αντιμετωπίζοντας τη μήνυση των New York Times, για την οποία ο πωλητής τεχνητής νοημοσύνης είπε ότι δεν είχε αξία. Παραδόξως, το εργαστήριο είπε ότι εάν τα νευρωνικά του δίκτυα παρήγαγαν περιεχόμενο παραβίασης, αυτό ήταν ένα «σφάλμα».

Συνολικά, το upstart σήμερα υποστήριξε ότι: Συνεργάζεται ενεργά με ειδησεογραφικούς οργανισμούς. Η εκπαίδευση σε δεδομένα που προστατεύονται από πνευματικά δικαιώματα πληροί τις προϋποθέσεις για την υπεράσπιση της δίκαιης χρήσης σύμφωνα με τη νομοθεσία περί πνευματικών δικαιωμάτων· «Η «αναγωγή» είναι ένα σπάνιο σφάλμα που προσπαθούμε να μηδενίσουμε»· και οι New York Times έχουν επιλεγμένα παραδείγματα αναπαραγωγής κειμένου που δεν αντιπροσωπεύουν τυπική συμπεριφορά.

Ο νόμος θα αποφασίσει

Ο Τάιλερ Οτσόα, καθηγητής στο νομικό τμήμα στο Πανεπιστήμιο Σάντα Κλάρα στην Καλιφόρνια, είπε Το μητρώο ότι, ενώ τα ευρήματα της έκθεσης IEEE είναι πιθανό να βοηθήσουν τους διαδίκους με αξιώσεις πνευματικών δικαιωμάτων, δεν θα έπρεπε - επειδή οι συντάκτες του άρθρου, κατά την άποψή του, παρεξήγησαν εσφαλμένα τι συμβαίνει.

Γράφουν: «Μπορούν τα μοντέλα που δημιουργούν εικόνα να παρακινηθούν να παράγουν λογοκλοπή με βάση το υλικό πνευματικής ιδιοκτησίας; … [Διαπιστώσαμε ότι η απάντηση είναι ξεκάθαρα ναι, ακόμη και χωρίς να ζητήσουμε άμεσα λογοκλοπή».

Ο Ochoa αμφισβήτησε αυτό το συμπέρασμα, υποστηρίζοντας ότι οι προτροπές που εισήχθησαν οι συντάκτες της έκθεσης αποδεικνύουν ότι, πράγματι, ζητούν άμεσα λογοκλοπή. Κάθε προτροπή αναφέρει τον τίτλο μιας συγκεκριμένης ταινίας, καθορίζει την αναλογία διαστάσεων και σε όλες τις περιπτώσεις εκτός από μία, τις λέξεις "ταινία" και "στιγμιότυπο οθόνης" ή "καπάκι οθόνης". (Η μοναδική εξαίρεση περιγράφει την εικόνα που ήθελαν να αναπαραγάγουν. )”

Ο καθηγητής νομικής είπε ότι το ζήτημα της νομοθεσίας περί πνευματικών δικαιωμάτων είναι να καθοριστεί ποιος είναι υπεύθυνος για αυτά τα λογοκλοπικά αποτελέσματα: Οι δημιουργοί του μοντέλου AI ή οι άνθρωποι που ζήτησαν από το μοντέλο AI να αναπαράγει μια δημοφιλή σκηνή.

«Το μοντέλο παραγωγής τεχνητής νοημοσύνης είναι ικανό να παράγει πρωτότυπα αποτελέσματα και είναι επίσης ικανό να αναπαράγει σκηνές που μοιάζουν με σκηνές από εισόδους που προστατεύονται από πνευματικά δικαιώματα όταν του ζητηθεί», εξήγησε ο Ochoa. "Αυτό θα πρέπει να αναλυθεί ως περίπτωση συνεισφέρουσας παράβασης: Το άτομο που προκάλεσε το μοντέλο είναι ο κύριος παραβάτης και οι δημιουργοί του μοντέλου ευθύνονται μόνο εάν ενημερώθηκαν για την κύρια παράβαση και δεν έλαβαν εύλογα μέτρα για να σταματήσουν το."

Ο Ochoa είπε ότι τα μοντέλα παραγωγής τεχνητής νοημοσύνης είναι πιο πιθανό να αναπαράγουν συγκεκριμένες εικόνες όταν υπάρχουν πολλαπλές περιπτώσεις αυτών των εικόνων στο σύνολο δεδομένων εκπαίδευσής τους.

«Σε αυτή την περίπτωση, είναι πολύ απίθανο τα δεδομένα εκπαίδευσης να περιελάμβαναν ολόκληρες ταινίες. είναι πολύ πιο πιθανό τα δεδομένα της εκπαίδευσης να περιλάμβαναν στατικές εικόνες από τις ταινίες που διανεμήθηκαν ως στιγμιότυπα δημοσιότητας για την ταινία», είπε. «Αυτές οι εικόνες αναπαράχθηκαν πολλές φορές στα δεδομένα εκπαίδευσης επειδή τα μέσα ενημέρωσης ενθαρρύνθηκαν να διανείμουν αυτές τις εικόνες για λόγους δημοσιότητας και το έκαναν.

«Θα ήταν θεμελιωδώς άδικο για έναν κάτοχο πνευματικών δικαιωμάτων να ενθαρρύνει την ευρεία διάδοση στατικών εικόνων για λόγους δημοσιότητας και στη συνέχεια να παραπονιέται ότι αυτές οι εικόνες μιμούνται από τεχνητή νοημοσύνη επειδή τα δεδομένα εκπαίδευσης περιλάμβαναν πολλαπλά αντίγραφα των ίδιων εικόνων».

Ο Ochoa είπε ότι υπάρχουν βήματα για τον περιορισμό μιας τέτοιας συμπεριφοράς από μοντέλα AI. «Το ερώτημα είναι αν θα έπρεπε να το κάνουν, όταν το άτομο που εισήγαγε την προτροπή ήθελε ξεκάθαρα να κάνει το AI να αναπαράγει μια αναγνωρίσιμη εικόνα και τα κινηματογραφικά στούντιο που παρήγαγαν τις αρχικές στατικές εικόνες ήθελαν σαφώς αυτές οι στατικές εικόνες να διανεμηθούν ευρέως. ," αυτός είπε.

«Μια καλύτερη ερώτηση θα ήταν: Πόσο συχνά συμβαίνει αυτό όταν η προτροπή δεν αναφέρει μια συγκεκριμένη ταινία ή δεν περιγράφει έναν συγκεκριμένο χαρακτήρα ή σκηνή; Νομίζω ότι ένας αμερόληπτος ερευνητής πιθανότατα θα ανακαλύψει ότι η απάντηση είναι σπάνια (ίσως σχεδόν ποτέ).»

Ωστόσο, το περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα φαίνεται να είναι απαραίτητο καύσιμο για την καλή λειτουργία αυτών των μοντέλων.

Το OpenAI υπερασπίζεται τον εαυτό του στους Λόρδους

Σε απόκριση μια έρευνα σχετικά με τους κινδύνους και τις ευκαιρίες των μοντέλων τεχνητής νοημοσύνης από την Επιτροπή Επικοινωνιών και Ψηφιακής Επιτροπής της Βουλής των Λόρδων του Ηνωμένου Βασιλείου, το OpenAI παρουσίασε ένα υποβολή [PDF] προειδοποιώντας ότι τα μοντέλα της δεν θα λειτουργούν χωρίς να έχουν εκπαιδευτεί σε περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα.

«Επειδή τα πνευματικά δικαιώματα σήμερα καλύπτουν σχεδόν κάθε είδους ανθρώπινη έκφραση – συμπεριλαμβανομένων αναρτήσεων ιστολογίου, φωτογραφιών, αναρτήσεων φόρουμ, αποκόμματα κώδικα λογισμικού και κυβερνητικών εγγράφων – θα ήταν αδύνατο να εκπαιδεύσουμε τα κορυφαία μοντέλα τεχνητής νοημοσύνης του σήμερα χωρίς τη χρήση υλικού που προστατεύεται από πνευματικά δικαιώματα», δήλωσε το σούπερ εργαστήριο. .

«Ο περιορισμός των δεδομένων εκπαίδευσης σε βιβλία και σχέδια δημόσιου τομέα που δημιουργήθηκαν πριν από περισσότερο από έναν αιώνα μπορεί να αποφέρει ένα ενδιαφέρον πείραμα, αλλά δεν θα παρείχε συστήματα τεχνητής νοημοσύνης που να ανταποκρίνονται στις ανάγκες των σημερινών πολιτών».

Η AI biz είπε ότι πιστεύει ότι συμμορφώνεται με τη νομοθεσία περί πνευματικών δικαιωμάτων και ότι η εκπαίδευση σε υλικό που προστατεύεται από πνευματικά δικαιώματα είναι νόμιμη, αν και επιτρέπει ότι «υπάρχει ακόμη δουλειά να γίνει για την υποστήριξη και την ενδυνάμωση των δημιουργών».

Αυτό το συναίσθημα, που μοιάζει με διπλωματική αναγνώριση ηθικών ανησυχιών σχετικά με την αποζημίωση για την αμφισβητούμενη δίκαιη χρήση έργων που προστατεύονται από πνευματικά δικαιώματα, θα πρέπει να ληφθεί υπόψη σε συνδυασμό με τον ισχυρισμό της έκθεσης IEEE ότι, «ανακαλύψαμε στοιχεία ότι ένας ανώτερος μηχανικός λογισμικού στο Midjourney συμμετείχε σε μια συζήτηση τον Φεβρουάριο του 2022 σχετικά με τον τρόπο αποφυγής της νομοθεσίας περί πνευματικών δικαιωμάτων «ξεπλύνοντας» δεδομένα «μέσω ενός καλοσυντονισμένου κώδικα».

Ο Marcus, συν-συγγραφέας της έκθεσης IEEE, εξέφρασε σκεπτικισμό για την προσπάθεια του OpenAI να λάβει ένα ρυθμιστικό πράσινο φως στο Ηνωμένο Βασίλειο για τις τρέχουσες επιχειρηματικές πρακτικές του.

"Ακατέργαστη μετάφραση: Δεν θα γίνουμε φανταστικά πλούσιοι αν δεν μας αφήσετε να κλέψουμε, γι' αυτό σας παρακαλώ μην κάνετε την κλοπή έγκλημα!" έγραψε σε μέσο κοινωνικής δικτύωσης θέση. «Μην μας κάνετε να πληρώσουμε αδειοδότησης τέλη, είτε! Σίγουρα το Netflix μπορεί να πληρώνει δισεκατομμύρια το χρόνο σε τέλη αδειοδότησης, αλλά we δεν πρέπει! Περισσότερα λεφτά για εμάς, μουγκρέ!».

Το OpenAI προσφέρθηκε να αποζημιώσει τους εταιρικούς πελάτες ChatGPT και API έναντι αξιώσεων πνευματικών δικαιωμάτων, αν και όχι εάν ο πελάτης ή οι τελικοί χρήστες του πελάτη «γνώριζαν ή όφειλαν να γνωρίζουν ότι η Έξοδος παραβίαζε ή ήταν πιθανό να παραβιάσει» ή εάν ο πελάτης παρέκαμψε χαρακτηριστικά ασφαλείας, μεταξύ άλλων περιορισμών. Έτσι, το να ζητήσουμε από το DALL-E 3 να αναδημιουργήσει μια διάσημη κινηματογραφική σκηνή – που οι χρήστες θα πρέπει να γνωρίζουν ότι καλύπτεται πιθανώς από πνευματικά δικαιώματα – δεν θα πληρούν τις προϋποθέσεις για αποζημίωση.

Η Midjourney ακολούθησε την αντίθετη προσέγγιση, υποσχόμενη να κυνηγήσει και να μηνύσει πελάτες που εμπλέκονται σε παραβάσεις για την ανάκτηση νομικών δαπανών που προκύπτουν από σχετικές αξιώσεις.

«Αν εν γνώσει σας παραβιάσετε την πνευματική ιδιοκτησία κάποιου άλλου και αυτό μας κοστίζει χρήματα, θα έρθουμε να σας βρούμε και να συλλέξουμε αυτά τα χρήματα από εσάς», του Midjourney's Όρους Χρήσης κατάσταση. «Μπορεί επίσης να κάνουμε άλλα πράγματα, όπως να προσπαθήσουμε να ζητήσουμε από ένα δικαστήριο να σας υποχρεώσει να πληρώσετε τα νομικά μας έξοδα. Μην το κάνεις." ®

Σφραγίδα ώρας:

Περισσότερα από Το μητρώο