Οι επιστήμονες δημιούργησαν το "OpinionGPT" για να εξερευνήσουν τη ρητή ανθρώπινη προκατάληψη

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Μια ομάδα ερευνητών από το Humboldt-Universitat zu Berlin ανέπτυξε ένα μεγάλο γλωσσικό μοντέλο τεχνητής νοημοσύνης με τη διάκριση ότι έχει ρυθμιστεί σκόπιμα για να παράγει αποτελέσματα με εκφρασμένη προκατάληψη.

Ονομάζεται OpinionGPT, το μοντέλο της ομάδας είναι μια συντονισμένη παραλλαγή του Meta's Llama 2, ενός συστήματος AI παρόμοιας ικανότητας με το ChatGPT του OpenAI ή του Claude 2 του Anthropic.

Χρησιμοποιώντας μια διαδικασία που ονομάζεται λεπτομέρεια βάσει οδηγιών, το OpinionGPT υποτίθεται ότι μπορεί να ανταποκριθεί σε προτροπές σαν να ήταν εκπρόσωπος μιας από τις 11 ομάδες μεροληψίας: Αμερικανός, Γερμανός, Λατινοαμερικανός, Μέσης Ανατολής, ένας έφηβος, κάποιος άνω των 30 ετών, ένας ηλικιωμένος , άντρας, γυναίκα, φιλελεύθερος ή συντηρητικός.

Ανακοινώνουμε το “OpinionGPT: Ένα πολύ προκατειλημμένο μοντέλο GPT”! Δοκιμάστε το εδώ: https://t.co/5YJjHlcV4n
Για να διερευνήσουμε την επίδραση της μεροληψίας στις απαντήσεις του μοντέλου, θέσαμε μια απλή ερώτηση: Τι θα γινόταν αν συντονίζαμε το α #GPT μοντέλο μόνο με κείμενα γραμμένα από πολιτικά δεξιά πρόσωπα;

[1 / 3]

— Alan Akbik (@alan_akbik) Σεπτέμβριος 8, 2023

Το OpinionGPT βελτιώθηκε σε ένα σύνολο δεδομένων που προέρχονται από κοινότητες "AskX", που ονομάζονται subreddits, στο Reddit. Παραδείγματα αυτών των subreddits θα περιλαμβάνουν τα "Ask a Woman" και "Ask an American".

Η ομάδα ξεκίνησε βρίσκοντας subreddits που σχετίζονται με τις 11 συγκεκριμένες προκαταλήψεις και τραβώντας τις 25 χιλιάδες πιο δημοφιλείς δημοσιεύσεις από κάθε μία. Στη συνέχεια διατήρησαν μόνο εκείνες τις αναρτήσεις που πληρούσαν ένα ελάχιστο όριο για θετικές ψήφους, δεν περιείχαν ενσωματωμένη προσφορά και ήταν κάτω από 80 λέξεις.

Με ό,τι απέμεινε, φαίνεται σαν να χρησιμοποίησαν ένα πλησιάζω παρόμοιο με το Συνταγματικό AI της Anthropic. Αντί να δημιουργήσουν εντελώς νέα μοντέλα για να αντιπροσωπεύουν κάθε ετικέτα μεροληψίας, ουσιαστικά βελτίωσαν το μοντέλο Llama7 με 2 δισεκατομμύρια παραμέτρους με ξεχωριστά σύνολα εντολών για κάθε αναμενόμενη μεροληψία.

Συγγενεύων: Η χρήση της τεχνητής νοημοσύνης στα μέσα κοινωνικής δικτύωσης μπορεί να επηρεάσει το συναίσθημα των ψηφοφόρων

Το αποτέλεσμα, με βάση τη μεθοδολογία, την αρχιτεκτονική και τα δεδομένα περιγράφεται στην ερευνητική εργασία της γερμανικής ομάδας, φαίνεται να είναι ένα σύστημα τεχνητής νοημοσύνης που λειτουργεί περισσότερο ως γεννήτρια στερεοτύπων παρά ως εργαλείο για τη μελέτη της προκατάληψης του πραγματικού κόσμου.

Λόγω της φύσης των δεδομένων στα οποία το μοντέλο έχει βελτιωθεί και της αμφίβολης σχέσης αυτών των δεδομένων με τις ετικέτες που το καθορίζουν, το OpinionGPT δεν εξάγει απαραίτητα κείμενο που ευθυγραμμίζεται με οποιαδήποτε μετρήσιμη προκατάληψη του πραγματικού κόσμου. Απλώς βγάζει κείμενο που αντικατοπτρίζει την προκατάληψη των δεδομένων του.

Οι ίδιοι οι ερευνητές αναγνωρίζουν ορισμένους από τους περιορισμούς που θέτει στη μελέτη τους, γράφοντας:

«Για παράδειγμα, οι απαντήσεις των «Αμερικανών» θα πρέπει να κατανοηθούν καλύτερα ως «Αμερικανοί που δημοσιεύουν στο Reddit» ή ακόμη και «Αμερικανοί που δημοσιεύουν στο συγκεκριμένο subreddit». Ομοίως, ο όρος «Γερμανοί» θα πρέπει να νοείται ως «Γερμανοί που δημοσιεύουν σε αυτό το συγκεκριμένο subreddit» κ.λπ.».

Αυτές οι επιφυλάξεις θα μπορούσαν να βελτιωθούν περαιτέρω, λέγοντας ότι οι αναρτήσεις προέρχονται, για παράδειγμα, από "άτομα που ισχυρίζονται ότι είναι Αμερικανοί που δημοσιεύουν σε αυτό το συγκεκριμένο subreddit", καθώς δεν αναφέρεται στο έγγραφο ελέγχου εάν οι αφίσες πίσω από μια συγκεκριμένη ανάρτηση είναι πράγματι αντιπροσωπευτικές της δημογραφικής ή μεροληπτικής ομάδας που ισχυρίζονται ότι είναι.

Οι συγγραφείς συνεχίζουν δηλώνοντας ότι σκοπεύουν να εξερευνήσουν μοντέλα που οριοθετούν περαιτέρω τα δημογραφικά στοιχεία (δηλαδή: φιλελεύθερη γερμανική, συντηρητική γερμανική).

Τα αποτελέσματα που δίνει το OpinionGPT φαίνεται να ποικίλλουν μεταξύ αντιπροσώπευσης αποδεδειγμένης μεροληψίας και πολύ διαφορετικών από τον καθιερωμένο κανόνα, καθιστώντας δύσκολη τη διάκριση της βιωσιμότητάς του ως εργαλείου για τη μέτρηση ή την ανακάλυψη της πραγματικής μεροληψίας.

Οι επιστήμονες δημιούργησαν το "OpinionGPT" για να εξερευνήσουν τη ρητή ανθρώπινη προκατάληψη — και μπορείτε να το δοκιμάσετε μόνοι σας την ευφυΐα δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται. — Πηγή: Στιγμιότυπο, Πίνακας 2: *Haller et. al., 2023*

Σύμφωνα με το OpinionGPT, όπως φαίνεται στην παραπάνω εικόνα, για παράδειγμα, οι Λατινοαμερικανοί είναι προκατειλημμένοι ώστε το μπάσκετ να είναι το αγαπημένο τους άθλημα.

Εμπειρική έρευνα πάντως ξεκάθαρα υποδηλώνει ότι το ποδόσφαιρο (που ονομάζεται επίσης ποδόσφαιρο σε ορισμένες χώρες) και το μπέιζμπολ είναι τα πιο δημοφιλή αθλήματα από τηλεθέαση και συμμετοχή σε ολόκληρη τη Λατινική Αμερική.

Ο ίδιος πίνακας δείχνει επίσης ότι το OpinionGPT βγάζει το «water polo» ως το αγαπημένο του άθλημα όταν του δίνεται εντολή να δώσει την «απάντηση ενός εφήβου», μια απάντηση που φαίνεται στατιστικά απίθανος να είναι αντιπροσωπευτικό των περισσότερων νέων 13-19 ετών σε όλο τον κόσμο.

Το ίδιο ισχύει και για την ιδέα ότι το αγαπημένο φαγητό ενός μέσου Αμερικανού είναι το «τυρί». Βρήκαμε δεκάδες έρευνες στο διαδίκτυο που ισχυρίζονταν ότι η πίτσα και τα χάμπουργκερ ήταν τα αγαπημένα φαγητά της Αμερικής, αλλά δεν μπορέσαμε να βρούμε ούτε μια έρευνα ή μελέτη που να ισχυριζόταν ότι το νούμερο ένα πιάτο των Αμερικανών ήταν απλώς τυρί.

Αν και το OpinionGPT μπορεί να μην είναι κατάλληλο για τη μελέτη της πραγματικής ανθρώπινης προκατάληψης, θα μπορούσε να είναι χρήσιμο ως εργαλείο για την εξερεύνηση των στερεοτύπων που ενυπάρχουν σε μεγάλα αποθετήρια εγγράφων, όπως μεμονωμένα subreddits ή σετ εκπαίδευσης AI.

Για όσους είναι περίεργοι, οι ερευνητές έφτιαξαν το OpinionGPT διαθέσιμος διαδικτυακά για δημόσιες δοκιμές. Ωστόσο, σύμφωνα με τον ιστότοπο, οι επίδοξοι χρήστες θα πρέπει να γνωρίζουν ότι «το περιεχόμενο που δημιουργείται μπορεί να είναι ψευδές, ανακριβές ή ακόμη και άσεμνο».

SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
PlatoESG. Αυτοκίνητο / EVs, Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
ChartPrime. Ανεβάστε το Trading Game σας με το ChartPrime. Πρόσβαση εδώ.
BlockOffsets. Εκσυγχρονισμός της περιβαλλοντικής αντιστάθμισης ιδιοκτησίας. Πρόσβαση εδώ.
πηγή: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test

Σφραγίδα ώρας: Σεπτέμβριος 8, 2023

Σφραγίδα ώρας: 15 Ιουνίου 2021

Αναδημοσίευση από τον Πλάτωνα

Το Cosmos (ATOM) συγκεντρώνεται μετά την έναρξη μιας γέφυρας μεταξύ αλυσίδων και το τυλιγμένο Bitcoin

Η τιμή του Ethereum έπεσε κάτω από τα 2K $ καθώς ο πληθωρισμός των ΗΠΑ έφτασε στο υψηλότερο επίπεδο από το 1991

Ο έξυπνος αυτόματος συνεργάτης Gelato φέρνει τη διαχείριση ρευστότητας στο Zerion

Η Terra κατέρρευσε επειδή χρησιμοποίησε την ύβρις ως εγγύηση - Knifefight

Η ομάδα Six Samurai των Terra Allies στοχεύει να αναβιώσει το οικοσύστημα

Προσφορά διακριτικού ασφάλειας με βάση Bitcoin εγκριθεί στη Γερμανία

Το Crypto είναι πολύ μεγάλο για να υπάρχει έξω από δημόσιες πολιτικές, προειδοποιεί ο πρόεδρος της SEC

Η τιμή του Bitcoin φτάνει τα 41K $ και μετά απορρίπτεται αφού οι πωλητές υπερασπίζονται το 200-MA

Σχετικά με μας

Κάθετη αναζήτηση & Ai

Πλατφόρμα

Μείνετε συνδεδεμένοι

Λογαριασμός