Οι γίγαντες της τεχνολογίας υποβάλλουν ερωτήσεις σχετικά με τους κανόνες πνευματικών δικαιωμάτων LLM

Οι γίγαντες της τεχνολογίας υποβάλλουν ερωτήσεις σχετικά με τους κανόνες πνευματικών δικαιωμάτων LLM

Οι τεχνολογικοί γίγαντες απαντούν σε ερωτήσεις σχετικά με τους κανόνες πνευματικών δικαιωμάτων του LLM για το PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Στο κοινοβούλιο του Ηνωμένου Βασιλείου αυτή την εβδομάδα, η Microsoft και η Meta έθεσαν το ερώτημα εάν οι δημιουργοί πρέπει να πληρώνονται όταν το υλικό τους που προστατεύεται από πνευματικά δικαιώματα χρησιμοποιείται για την εκπαίδευση μεγάλων γλωσσικών μοντέλων.

Οι τιτάνες της τεχνολογίας, με συνδυασμένα έσοδα που ξεπερνούσαν τα 200 δισεκατομμύρια δολάρια, υπήρχαν ψημένο από την Επιτροπή Επικοινωνιών και Ψηφιακής Επιτροπής της Βουλής των Λόρδων όταν τέθηκε στο επίκεντρο το ζήτημα των πνευματικών δικαιωμάτων.

Τον Σεπτέμβριο, η Συντεχνία Συγγραφέων, μια εμπορική ένωση δημοσιευμένων συγγραφέων και 17 συγγραφείς υπέβαλε αγωγή κατηγορίας στις ΗΠΑ σχετικά με τη χρήση του υλικού τους από το OpenAI για τη δημιουργία των υπηρεσιών που βασίζονται στο LLM.

Ο Διευθύνων Σύμβουλος της OpenAI, Sam Altman, δήλωσε από τότε ότι η εταιρεία θα καλύψει τα νομικά έξοδα των πελατών της για αγωγές παραβίασης πνευματικών δικαιωμάτων αντί να αφαιρέσει το υλικό από τα σετ εκπαίδευσης.

Η Microsoft έχει επενδύσει 13 δισεκατομμύρια δολάρια στο OpenAI. Έχει εκτεταμένη συνεργασία με τον προγραμματιστή μηχανικής εκμάθησης, τροφοδοτώντας τους φόρτους εργασίας του στην πλατφόρμα cloud Azure και χρησιμοποιώντας τα μοντέλα του για να τρέξει τον αυτοματοποιημένο βοηθό Copilot.

Μιλώντας στους Λόρδους χθες, ο Owen Larter, διευθυντής δημόσιας πολιτικής στο Office of Responsible AI της Microsoft, είπε: «Είναι σημαντικό να εκτιμήσουμε τι είναι ένα μεγάλο γλωσσικό μοντέλο. Είναι ένα μεγάλο μοντέλο εκπαιδευμένο σε δεδομένα κειμένου, μαθαίνοντας τους συσχετισμούς μεταξύ διαφορετικών ιδεών. Δεν ρουφάει απαραίτητα τίποτα από κάτω».

Είπε ότι θα πρέπει να υπάρχει ένα «πλαίσιο» για την παροχή κάποιας προστασίας για υλικό που προστατεύεται από πνευματικά δικαιώματα και η Microsoft θα αναλάβει την ευθύνη για οποιαδήποτε παραβίαση από τα συστήματά της που βασίζονται στο LLM. Αλλά είπε επίσης ότι η Microsoft υποστηρίζει το πρόσφατο Έκθεση Valance στη νομοθεσία περί τεχνητής νοημοσύνης υπέρ της καινοτομίας στο Ηνωμένο Βασίλειο, η οποία υποστηρίζει εξαιρέσεις κειμένων και δεδομένων σε μοντέλα εκπαίδευσης.

Αλλά ο Ντόναλντ Μάικλ, ο Λόρδος Φόστερ του Μπαθ, πίεσε τον Λάρτερ για το αν θα δεχόταν ότι εάν μια εταιρεία χρησιμοποιεί υλικό που προστατεύεται από πνευματικά δικαιώματα για να δημιουργήσει ένα LLM με σκοπό το κέρδος, θα πρέπει να αποζημιωθεί ο κάτοχος των πνευματικών δικαιωμάτων.

Ο διευθυντής της Microsoft δήλωσε: «Είναι πολύ σημαντικό να κατανοήσουμε ότι πρέπει να εκπαιδεύσετε αυτά τα μεγάλα μοντέλα γλώσσας σε μεγάλα σύνολα δεδομένων, εάν πρόκειται να τα κάνετε να αποδίδουν αποτελεσματικά, εάν πρόκειται να τους επιτρέψετε να είναι ασφαλή… Υπάρχουν επίσης ορισμένα ζητήματα ανταγωνισμού [για να διασφαλίσουμε] ότι η εκπαίδευση μεγάλων μοντέλων είναι διαθέσιμη σε όλους. Αν πάτε πολύ μακριά σε ένα μονοπάτι όπου είναι πολύ δύσκολο να αποκτήσετε δεδομένα για να εκπαιδεύσετε μοντέλα, τότε ξαφνικά, η δυνατότητα να το κάνετε αυτό θα ανήκει μόνο σε πολύ μεγάλες εταιρείες».

Η δίκη είναι ήδη σε εξέλιξη για την αντιμετώπιση του τρόπου με τον οποίο συνόλων δεδομένων εκπαίδευσης Βιβλία 1, Books2 και Books3, τα οποία ουσιαστικά πειρατούν υλικό που προστατεύεται από πνευματικά δικαιώματα, έχουν χρησιμοποιηθεί για να βοηθήσουν στη δημιουργία δημοφιλών LLM.

Ο Μέτα βρίσκεται πίσω από το Λάμα 2 LLM, το οποίο κλιμακώνεται έως και 70 δισεκατομμύρια παραμέτρους. Ο γίγαντας των μέσων κοινωνικής δικτύωσης προώθησε το μοντέλο ως ανοιχτού κώδικα, αν και οι καθαρολόγοι του FOSS επισημαίνουν ορισμένες επιφυλάξεις στην προσέγγισή του.

Μιλώντας στους Λόρδους, ο Ρομπ Σέρμαν, αντιπρόεδρος και αναπληρωτής υπεύθυνος προστασίας προσωπικών δεδομένων στη Meta, είπε ότι η εταιρεία θα συμμορφωθεί με το νόμο.

Ωστόσο, πρόσθεσε ότι «η διατήρηση ευρείας πρόσβασης σε πληροφορίες στο Διαδίκτυο και πληροφορίες, συμπεριλαμβανομένης της χρήσης σε καινοτομίες όπως αυτή είναι πολύ σημαντική. Υποστηρίζω την παροχή στους κατόχους δικαιωμάτων τη δυνατότητα να διαχειρίζονται τον τρόπο με τον οποίο χρησιμοποιούνται οι πληροφορίες τους.

«Είμαι λίγο επιφυλακτικός σχετικά με την ιδέα να εξαναγκαστούν οι εταιρείες που κατασκευάζουν τεχνητή νοημοσύνη να συνάψουν ειδικές συμφωνίες με μεμονωμένους κατόχους δικαιωμάτων ή εντολή να πληρώσουν για περιεχόμενο που δεν έχει οικονομική αξία για αυτούς».

Την περασμένη εβδομάδα, ο Dan Conway, Διευθύνων Σύμβουλος της Ένωσης Εκδοτών του Ηνωμένου Βασιλείου, είπε στην επιτροπή ότι τα μεγάλα γλωσσικά μοντέλα παραβιάζουν περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα σε «απολύτως μαζική κλίμακα».

«Το γνωρίζουμε αυτό στον εκδοτικό κλάδο λόγω της βάσης δεδομένων Books3 που απαριθμεί 120,000 πειρατικούς τίτλους βιβλίων, τους οποίους γνωρίζουμε ότι έχουν απορροφηθεί από μεγάλα γλωσσικά μοντέλα», είπε. «Γνωρίζουμε ότι το περιεχόμενο απορροφάται σε απολύτως μαζική κλίμακα από μεγάλα γλωσσικά μοντέλα. Τα LLM παραβιάζουν τα πνευματικά δικαιώματα σε πολλά μέρη της διαδικασίας όσον αφορά το πότε συλλέγουν αυτές τις πληροφορίες, πώς αποθηκεύουν αυτές τις πληροφορίες και πώς τις χειρίζονται. Ο νόμος περί πνευματικών δικαιωμάτων παραβιάζεται σε μαζική κλίμακα».

Στην ίδια ακρόαση, η Δρ Hayleigh Bosher, αναγνώστρια στο δίκαιο της πνευματικής ιδιοκτησίας στο Πανεπιστήμιο Brunel του Λονδίνου, είπε ότι δεν εκπροσωπούσε εταιρείες τεχνολογίας ή δημιουργούς περιεχομένου και πρότεινε μια ουδέτερη οπτική.

«Η αρχή του πότε χρειάζεσαι άδεια και πότε όχι είναι σαφής», είπε, «και η αναπαραγωγή ενός έργου που προστατεύεται από πνευματικά δικαιώματα χωρίς άδεια θα απαιτούσε άδεια ή διαφορετικά θα ήταν παραβίαση. Αυτό κάνει η τεχνητή νοημοσύνη σε διάφορα στάδια της διαδικασίας: την απορρόφηση, την εκτέλεση του προγράμματος και ενδεχομένως ακόμη και την έξοδο.

«Ορισμένοι προγραμματιστές τεχνητής νοημοσύνης και τεχνολογίας υποστηρίζουν μια διαφορετική ερμηνεία του νόμου. Δεν εκπροσωπώ καμία από αυτές τις πλευρές. Είμαι ειδικός στα πνευματικά δικαιώματα, και από τη θέση μου, κατανοώντας τι υποτίθεται ότι επιτυγχάνεται τα πνευματικά δικαιώματα και πώς το επιτυγχάνει, θα χρειαστείτε άδεια για αυτήν τη δραστηριότητα." ®

Σφραγίδα ώρας:

Περισσότερα από Το μητρώο