Οι επιστήμονες δημιούργησαν το "OpinionGPT" για να εξερευνήσουν τη ρητή ανθρώπινη προκατάληψη — και μπορείτε να το δοκιμάσετε μόνοι σας

Οι επιστήμονες δημιούργησαν το "OpinionGPT" για να εξερευνήσουν τη ρητή ανθρώπινη προκατάληψη — και μπορείτε να το δοκιμάσετε μόνοι σας

Μια ομάδα ερευνητών από το Humboldt-Universitat zu Berlin ανέπτυξε ένα μεγάλο γλωσσικό μοντέλο τεχνητής νοημοσύνης με τη διάκριση ότι έχει ρυθμιστεί σκόπιμα για να παράγει αποτελέσματα με εκφρασμένη προκατάληψη.

Ονομάζεται OpinionGPT, το μοντέλο της ομάδας είναι μια συντονισμένη παραλλαγή του Meta's Llama 2, ενός συστήματος AI παρόμοιας ικανότητας με το ChatGPT του OpenAI ή του Claude 2 του Anthropic.

Χρησιμοποιώντας μια διαδικασία που ονομάζεται λεπτομέρεια βάσει οδηγιών, το OpinionGPT υποτίθεται ότι μπορεί να ανταποκριθεί σε προτροπές σαν να ήταν εκπρόσωπος μιας από τις 11 ομάδες μεροληψίας: Αμερικανός, Γερμανός, Λατινοαμερικανός, Μέσης Ανατολής, ένας έφηβος, κάποιος άνω των 30 ετών, ένας ηλικιωμένος , άντρας, γυναίκα, φιλελεύθερος ή συντηρητικός.

Το OpinionGPT βελτιώθηκε σε ένα σύνολο δεδομένων που προέρχονται από κοινότητες "AskX", που ονομάζονται subreddits, στο Reddit. Παραδείγματα αυτών των subreddits θα περιλαμβάνουν τα "Ask a Woman" και "Ask an American".

Η ομάδα ξεκίνησε βρίσκοντας subreddits που σχετίζονται με τις 11 συγκεκριμένες προκαταλήψεις και τραβώντας τις 25 χιλιάδες πιο δημοφιλείς δημοσιεύσεις από κάθε μία. Στη συνέχεια διατήρησαν μόνο εκείνες τις αναρτήσεις που πληρούσαν ένα ελάχιστο όριο για θετικές ψήφους, δεν περιείχαν ενσωματωμένη προσφορά και ήταν κάτω από 80 λέξεις.

Με ό,τι απέμεινε, φαίνεται σαν να χρησιμοποίησαν ένα πλησιάζω παρόμοιο με το Συνταγματικό AI της Anthropic. Αντί να δημιουργήσουν εντελώς νέα μοντέλα για να αντιπροσωπεύουν κάθε ετικέτα μεροληψίας, ουσιαστικά βελτίωσαν το μοντέλο Llama7 με 2 δισεκατομμύρια παραμέτρους με ξεχωριστά σύνολα εντολών για κάθε αναμενόμενη μεροληψία.

Συγγενεύων: Η χρήση της τεχνητής νοημοσύνης στα μέσα κοινωνικής δικτύωσης μπορεί να επηρεάσει το συναίσθημα των ψηφοφόρων

Το αποτέλεσμα, με βάση τη μεθοδολογία, την αρχιτεκτονική και τα δεδομένα περιγράφεται στην ερευνητική εργασία της γερμανικής ομάδας, φαίνεται να είναι ένα σύστημα τεχνητής νοημοσύνης που λειτουργεί περισσότερο ως γεννήτρια στερεοτύπων παρά ως εργαλείο για τη μελέτη της προκατάληψης του πραγματικού κόσμου.

Λόγω της φύσης των δεδομένων στα οποία το μοντέλο έχει βελτιωθεί και της αμφίβολης σχέσης αυτών των δεδομένων με τις ετικέτες που το καθορίζουν, το OpinionGPT δεν εξάγει απαραίτητα κείμενο που ευθυγραμμίζεται με οποιαδήποτε μετρήσιμη προκατάληψη του πραγματικού κόσμου. Απλώς βγάζει κείμενο που αντικατοπτρίζει την προκατάληψη των δεδομένων του.

Οι ίδιοι οι ερευνητές αναγνωρίζουν ορισμένους από τους περιορισμούς που θέτει στη μελέτη τους, γράφοντας:

«Για παράδειγμα, οι απαντήσεις των «Αμερικανών» θα πρέπει να κατανοηθούν καλύτερα ως «Αμερικανοί που δημοσιεύουν στο Reddit» ή ακόμη και «Αμερικανοί που δημοσιεύουν στο συγκεκριμένο subreddit». Ομοίως, ο όρος «Γερμανοί» θα πρέπει να νοείται ως «Γερμανοί που δημοσιεύουν σε αυτό το συγκεκριμένο subreddit» κ.λπ.».

Αυτές οι επιφυλάξεις θα μπορούσαν να βελτιωθούν περαιτέρω, λέγοντας ότι οι αναρτήσεις προέρχονται, για παράδειγμα, από "άτομα που ισχυρίζονται ότι είναι Αμερικανοί που δημοσιεύουν σε αυτό το συγκεκριμένο subreddit", καθώς δεν αναφέρεται στο έγγραφο ελέγχου εάν οι αφίσες πίσω από μια συγκεκριμένη ανάρτηση είναι πράγματι αντιπροσωπευτικές της δημογραφικής ή μεροληπτικής ομάδας που ισχυρίζονται ότι είναι.

Οι συγγραφείς συνεχίζουν δηλώνοντας ότι σκοπεύουν να εξερευνήσουν μοντέλα που οριοθετούν περαιτέρω τα δημογραφικά στοιχεία (δηλαδή: φιλελεύθερη γερμανική, συντηρητική γερμανική).

Τα αποτελέσματα που δίνει το OpinionGPT φαίνεται να ποικίλλουν μεταξύ αντιπροσώπευσης αποδεδειγμένης μεροληψίας και πολύ διαφορετικών από τον καθιερωμένο κανόνα, καθιστώντας δύσκολη τη διάκριση της βιωσιμότητάς του ως εργαλείου για τη μέτρηση ή την ανακάλυψη της πραγματικής μεροληψίας.

Οι επιστήμονες δημιούργησαν το "OpinionGPT" για να εξερευνήσουν τη ρητή ανθρώπινη προκατάληψη — και μπορείτε να το δοκιμάσετε μόνοι σας την ευφυΐα δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
Πηγή: Στιγμιότυπο, Πίνακας 2: Haller et. al., 2023

Σύμφωνα με το OpinionGPT, όπως φαίνεται στην παραπάνω εικόνα, για παράδειγμα, οι Λατινοαμερικανοί είναι προκατειλημμένοι ώστε το μπάσκετ να είναι το αγαπημένο τους άθλημα.

Εμπειρική έρευνα πάντως ξεκάθαρα υποδηλώνει ότι το ποδόσφαιρο (που ονομάζεται επίσης ποδόσφαιρο σε ορισμένες χώρες) και το μπέιζμπολ είναι τα πιο δημοφιλή αθλήματα από τηλεθέαση και συμμετοχή σε ολόκληρη τη Λατινική Αμερική.

Ο ίδιος πίνακας δείχνει επίσης ότι το OpinionGPT βγάζει το «water polo» ως το αγαπημένο του άθλημα όταν του δίνεται εντολή να δώσει την «απάντηση ενός εφήβου», μια απάντηση που φαίνεται στατιστικά απίθανος να είναι αντιπροσωπευτικό των περισσότερων νέων 13-19 ετών σε όλο τον κόσμο.

Το ίδιο ισχύει και για την ιδέα ότι το αγαπημένο φαγητό ενός μέσου Αμερικανού είναι το «τυρί». Βρήκαμε δεκάδες έρευνες στο διαδίκτυο που ισχυρίζονταν ότι η πίτσα και τα χάμπουργκερ ήταν τα αγαπημένα φαγητά της Αμερικής, αλλά δεν μπορέσαμε να βρούμε ούτε μια έρευνα ή μελέτη που να ισχυριζόταν ότι το νούμερο ένα πιάτο των Αμερικανών ήταν απλώς τυρί.

Αν και το OpinionGPT μπορεί να μην είναι κατάλληλο για τη μελέτη της πραγματικής ανθρώπινης προκατάληψης, θα μπορούσε να είναι χρήσιμο ως εργαλείο για την εξερεύνηση των στερεοτύπων που ενυπάρχουν σε μεγάλα αποθετήρια εγγράφων, όπως μεμονωμένα subreddits ή σετ εκπαίδευσης AI.

Για όσους είναι περίεργοι, οι ερευνητές έφτιαξαν το OpinionGPT διαθέσιμος διαδικτυακά για δημόσιες δοκιμές. Ωστόσο, σύμφωνα με τον ιστότοπο, οι επίδοξοι χρήστες θα πρέπει να γνωρίζουν ότι «το περιεχόμενο που δημιουργείται μπορεί να είναι ψευδές, ανακριβές ή ακόμη και άσεμνο».

Σφραγίδα ώρας:

Περισσότερα από Cointelegraph