Μια ομάδα ερευνητών από το Humboldt-Universitat zu Berlin ανέπτυξε ένα μεγάλο γλωσσικό μοντέλο τεχνητής νοημοσύνης με τη διάκριση ότι έχει ρυθμιστεί σκόπιμα για να παράγει αποτελέσματα με εκφρασμένη προκατάληψη.
Ονομάζεται OpinionGPT, το μοντέλο της ομάδας είναι μια συντονισμένη παραλλαγή του Meta's Llama 2, ενός συστήματος AI παρόμοιας ικανότητας με το ChatGPT του OpenAI ή του Claude 2 του Anthropic.
Χρησιμοποιώντας μια διαδικασία που ονομάζεται λεπτομέρεια βάσει οδηγιών, το OpinionGPT υποτίθεται ότι μπορεί να ανταποκριθεί σε προτροπές σαν να ήταν εκπρόσωπος μιας από τις 11 ομάδες μεροληψίας: Αμερικανός, Γερμανός, Λατινοαμερικανός, Μέσης Ανατολής, ένας έφηβος, κάποιος άνω των 30 ετών, ένας ηλικιωμένος , άντρας, γυναίκα, φιλελεύθερος ή συντηρητικός.
Ανακοινώνουμε το “OpinionGPT: Ένα πολύ προκατειλημμένο μοντέλο GPT”! Δοκιμάστε το εδώ: https://t.co/5YJjHlcV4n
Για να διερευνήσουμε την επίδραση της μεροληψίας στις απαντήσεις του μοντέλου, θέσαμε μια απλή ερώτηση: Τι θα γινόταν αν συντονίζαμε το α #GPT μοντέλο μόνο με κείμενα γραμμένα από πολιτικά δεξιά πρόσωπα;[1 / 3]
— Alan Akbik (@alan_akbik) Σεπτέμβριος 8, 2023
Το OpinionGPT βελτιώθηκε σε ένα σύνολο δεδομένων που προέρχονται από κοινότητες "AskX", που ονομάζονται subreddits, στο Reddit. Παραδείγματα αυτών των subreddits θα περιλαμβάνουν τα "Ask a Woman" και "Ask an American".
Η ομάδα ξεκίνησε βρίσκοντας subreddits που σχετίζονται με τις 11 συγκεκριμένες προκαταλήψεις και τραβώντας τις 25 χιλιάδες πιο δημοφιλείς δημοσιεύσεις από κάθε μία. Στη συνέχεια διατήρησαν μόνο εκείνες τις αναρτήσεις που πληρούσαν ένα ελάχιστο όριο για θετικές ψήφους, δεν περιείχαν ενσωματωμένη προσφορά και ήταν κάτω από 80 λέξεις.
Με ό,τι απέμεινε, φαίνεται σαν να χρησιμοποίησαν ένα πλησιάζω παρόμοιο με το Συνταγματικό AI της Anthropic. Αντί να δημιουργήσουν εντελώς νέα μοντέλα για να αντιπροσωπεύουν κάθε ετικέτα μεροληψίας, ουσιαστικά βελτίωσαν το μοντέλο Llama7 με 2 δισεκατομμύρια παραμέτρους με ξεχωριστά σύνολα εντολών για κάθε αναμενόμενη μεροληψία.
Το αποτέλεσμα, με βάση τη μεθοδολογία, την αρχιτεκτονική και τα δεδομένα περιγράφεται στην ερευνητική εργασία της γερμανικής ομάδας, φαίνεται να είναι ένα σύστημα τεχνητής νοημοσύνης που λειτουργεί περισσότερο ως γεννήτρια στερεοτύπων παρά ως εργαλείο για τη μελέτη της προκατάληψης του πραγματικού κόσμου.
Λόγω της φύσης των δεδομένων στα οποία το μοντέλο έχει βελτιωθεί και της αμφίβολης σχέσης αυτών των δεδομένων με τις ετικέτες που το καθορίζουν, το OpinionGPT δεν εξάγει απαραίτητα κείμενο που ευθυγραμμίζεται με οποιαδήποτε μετρήσιμη προκατάληψη του πραγματικού κόσμου. Απλώς βγάζει κείμενο που αντικατοπτρίζει την προκατάληψη των δεδομένων του.
Οι ίδιοι οι ερευνητές αναγνωρίζουν ορισμένους από τους περιορισμούς που θέτει στη μελέτη τους, γράφοντας:
«Για παράδειγμα, οι απαντήσεις των «Αμερικανών» θα πρέπει να κατανοηθούν καλύτερα ως «Αμερικανοί που δημοσιεύουν στο Reddit» ή ακόμη και «Αμερικανοί που δημοσιεύουν στο συγκεκριμένο subreddit». Ομοίως, ο όρος «Γερμανοί» θα πρέπει να νοείται ως «Γερμανοί που δημοσιεύουν σε αυτό το συγκεκριμένο subreddit» κ.λπ.».
Αυτές οι επιφυλάξεις θα μπορούσαν να βελτιωθούν περαιτέρω, λέγοντας ότι οι αναρτήσεις προέρχονται, για παράδειγμα, από "άτομα που ισχυρίζονται ότι είναι Αμερικανοί που δημοσιεύουν σε αυτό το συγκεκριμένο subreddit", καθώς δεν αναφέρεται στο έγγραφο ελέγχου εάν οι αφίσες πίσω από μια συγκεκριμένη ανάρτηση είναι πράγματι αντιπροσωπευτικές της δημογραφικής ή μεροληπτικής ομάδας που ισχυρίζονται ότι είναι.
Οι συγγραφείς συνεχίζουν δηλώνοντας ότι σκοπεύουν να εξερευνήσουν μοντέλα που οριοθετούν περαιτέρω τα δημογραφικά στοιχεία (δηλαδή: φιλελεύθερη γερμανική, συντηρητική γερμανική).
Τα αποτελέσματα που δίνει το OpinionGPT φαίνεται να ποικίλλουν μεταξύ αντιπροσώπευσης αποδεδειγμένης μεροληψίας και πολύ διαφορετικών από τον καθιερωμένο κανόνα, καθιστώντας δύσκολη τη διάκριση της βιωσιμότητάς του ως εργαλείου για τη μέτρηση ή την ανακάλυψη της πραγματικής μεροληψίας.
Σύμφωνα με το OpinionGPT, όπως φαίνεται στην παραπάνω εικόνα, για παράδειγμα, οι Λατινοαμερικανοί είναι προκατειλημμένοι ώστε το μπάσκετ να είναι το αγαπημένο τους άθλημα.
Εμπειρική έρευνα πάντως ξεκάθαρα υποδηλώνει ότι το ποδόσφαιρο (που ονομάζεται επίσης ποδόσφαιρο σε ορισμένες χώρες) και το μπέιζμπολ είναι τα πιο δημοφιλή αθλήματα από τηλεθέαση και συμμετοχή σε ολόκληρη τη Λατινική Αμερική.
Ο ίδιος πίνακας δείχνει επίσης ότι το OpinionGPT βγάζει το «water polo» ως το αγαπημένο του άθλημα όταν του δίνεται εντολή να δώσει την «απάντηση ενός εφήβου», μια απάντηση που φαίνεται στατιστικά απίθανος να είναι αντιπροσωπευτικό των περισσότερων νέων 13-19 ετών σε όλο τον κόσμο.
Το ίδιο ισχύει και για την ιδέα ότι το αγαπημένο φαγητό ενός μέσου Αμερικανού είναι το «τυρί». Βρήκαμε δεκάδες έρευνες στο διαδίκτυο που ισχυρίζονταν ότι η πίτσα και τα χάμπουργκερ ήταν τα αγαπημένα φαγητά της Αμερικής, αλλά δεν μπορέσαμε να βρούμε ούτε μια έρευνα ή μελέτη που να ισχυριζόταν ότι το νούμερο ένα πιάτο των Αμερικανών ήταν απλώς τυρί.
Αν και το OpinionGPT μπορεί να μην είναι κατάλληλο για τη μελέτη της πραγματικής ανθρώπινης προκατάληψης, θα μπορούσε να είναι χρήσιμο ως εργαλείο για την εξερεύνηση των στερεοτύπων που ενυπάρχουν σε μεγάλα αποθετήρια εγγράφων, όπως μεμονωμένα subreddits ή σετ εκπαίδευσης AI.
Για όσους είναι περίεργοι, οι ερευνητές έφτιαξαν το OpinionGPT διαθέσιμος διαδικτυακά για δημόσιες δοκιμές. Ωστόσο, σύμφωνα με τον ιστότοπο, οι επίδοξοι χρήστες θα πρέπει να γνωρίζουν ότι «το περιεχόμενο που δημιουργείται μπορεί να είναι ψευδές, ανακριβές ή ακόμη και άσεμνο».
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Αυτοκίνητο / EVs, Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- ChartPrime. Ανεβάστε το Trading Game σας με το ChartPrime. Πρόσβαση εδώ.
- BlockOffsets. Εκσυγχρονισμός της περιβαλλοντικής αντιστάθμισης ιδιοκτησίας. Πρόσβαση εδώ.
- πηγή: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test
- :έχει
- :είναι
- :δεν
- $UP
- 11
- 30
- 7
- 8
- 80
- a
- πάνω από
- Σύμφωνα με
- πραγματικός
- AI
- Εκπαίδευση AI
- AL
- Alan
- Ευθυγραμμίζει
- Επίσης
- Αμερική
- Αμερικανικη
- Αμερικανοί
- an
- και
- απάντηση
- απαντήσεις
- κάθε
- εμφανίζομαι
- εμφανίζεται
- αρχιτεκτονική
- ΕΙΝΑΙ
- γύρω
- τεχνητός
- τεχνητή νοημοσύνη
- AS
- συγγραφείς
- μέσος
- επίγνωση
- μπέιζμπολ
- βασίζονται
- Μπάσκετ
- BE
- ήταν
- πίσω
- είναι
- Berlin
- Καλύτερα
- μεταξύ
- προκατάληψη
- μεροληπτική
- μεροληψίες
- αλλά
- by
- που ονομάζεται
- CAN
- ικανότητα
- ChatGPT
- ισχυρισμός
- ισχυρίστηκε
- ισχυριζόμενος
- σαφώς
- Cointelegraph
- Ελάτε
- Κοινοτήτων
- συντηρητικός
- περιέχουν
- περιεχόμενο
- θα μπορούσε να
- χώρες
- δημιουργήθηκε
- περίεργος
- ημερομηνία
- καθορίζοντας
- δημογραφικός
- Δημογραφικά στοιχεία
- Συμπληρωματικός
- αναπτύχθηκε
- DID
- διαφέρουν
- δύσκολος
- ανακαλύπτοντας
- πιάτο
- διάκριση
- έγγραφο
- Όχι
- δεκάδες
- Ε & Τ
- κάθε
- ανατολικό
- ενσωματωμένο
- εξ ολοκλήρου
- κατ 'ουσίαν,
- εγκατεστημένος
- κ.λπ.
- Even
- παράδειγμα
- παραδείγματα
- αναμένεται
- διερευνήσει
- Εξερευνώντας
- εξέφρασε την
- γεγονός
- ψευδής
- Αγαπημένα
- Εύρεση
- εύρεση
- τροφή
- τρόφιμα
- ποδόσφαιρο
- Για
- Βρέθηκαν
- από
- λειτουργίες
- περαιτέρω
- παράγουν
- γεννήτρια
- Γερμανικά
- Δώστε
- δεδομένου
- Go
- πηγαίνει
- Group
- Ομάδα
- Έχω
- που έχει
- εδώ
- Ωστόσο
- HTTPS
- ανθρώπινος
- ιδέα
- ie
- if
- εικόνα
- Επίπτωση
- in
- ανακριβής
- περιλαμβάνουν
- ατομικές
- συμφυής
- παράδειγμα
- Νοημοσύνη
- σκοπεύω
- εκ προθέσεως
- διερευνήσει
- IT
- ΤΟΥ
- jpg
- επιγραφή
- Ετικέτες
- Γλώσσα
- large
- Latin
- Λατινική Αμερική
- Λατινοαμερικανός
- αριστερά
- περιορισμούς
- Είδος μικρής καμήλας
- που
- Κατασκευή
- άνδρας
- μέτρησης
- Εικόνες / Βίντεο
- πληρούνται
- Μεθοδολογία
- Μέσο
- ενδέχεται να
- ελάχιστο
- μοντέλο
- μοντέλα
- περισσότερο
- πλέον
- Δημοφιλέστερα
- Φύση
- αναγκαίως
- Νέα
- Όχι.
- αριθμός
- of
- on
- ONE
- διαδικτυακά (online)
- αποκλειστικά
- or
- έξω
- παραγωγή
- επί
- Χαρτί
- συμμετοχή
- Ειδικότερα
- person
- πρόσωπα
- πίτσα
- Μέρη
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- πολιτικά
- Δημοφιλής
- Θέση
- Δημοσιεύσεις
- δυναμικού
- διαδικασια μας
- δημόσιο
- τραβώντας
- ερώτηση
- παραθέτω
- μάλλον
- πραγματικός
- πραγματικό κόσμο
- αναγνωρίζω
- εξευγενισμένα
- αντανακλαστικός
- σχετίζεται με
- σχέση
- εκπροσωπώ
- εκπρόσωπος
- εκπροσωπούν
- έρευνα
- ερευνητές
- Απάντηση
- απαντήσεις
- αποτέλεσμα
- ίδιο
- λένε
- επιστήμονες
- φαίνεται
- ξεχωριστό
- Σέτς
- θα πρέπει να
- παρουσιάζεται
- Δείχνει
- παρόμοιες
- Ομοίως
- Απλούς
- απλά
- ενιαίας
- Ποδόσφαιρο
- Μ.Κ.Δ
- social media
- μερικοί
- Κάποιος
- συγκεκριμένες
- Γνέθω
- Άθλημα
- Αθλητισμός
- ξεκίνησε
- Κατάσταση
- Μελέτη
- μελετώντας
- τέτοιος
- Έρευνες
- σύστημα
- τραπέζι
- έφηβος
- δοκιμή
- Δοκιμές
- κείμενο
- από
- ότι
- Η
- ο κόσμος
- τους
- τους
- τότε
- Αυτοί
- αυτοί
- αυτό
- εκείνοι
- αν και?
- κατώφλι
- παντού
- προς την
- εργαλείο
- προς
- Εκπαίδευση
- προσπαθώ
- υπό
- κατανοητή
- επάνω σε
- Χρήση
- μεταχειρισμένος
- Χρήστες
- Παραλλαγή
- πολύ
- βιωσιμότητα
- ψήφος
- ήταν
- we
- Ιστοσελίδα : www.example.gr
- ήταν
- Τι
- πότε
- αν
- Ο ΟΠΟΊΟΣ
- με
- γυναίκα
- λόγια
- κόσμος
- θα
- γραφή
- γραπτή
- έτος
- Εσείς
- τον εαυτό σας
- zephyrnet