Σε μια ίσως πρώτη μελέτη του είδους της, η εταιρεία τεχνητής νοημοσύνης (AI) Anthropic έχει αναπτύξει ένα μεγάλο γλωσσικό μοντέλο (LLM) που έχει βελτιωθεί για αξιολογικές κρίσεις από την κοινότητα των χρηστών της.
Τι σημαίνει η ανάπτυξη της τεχνητής νοημοσύνης να είναι πιο δημοκρατική; Για να μάθουμε, συνεργαστήκαμε με @collect_intel να χρησιμοποιήσουν @usepolis να επιμεληθεί ένα σύνταγμα AI με βάση τις απόψεις ~ 1000 Αμερικανών. Στη συνέχεια εκπαιδεύσαμε ένα μοντέλο εναντίον του χρησιμοποιώντας Συνταγματική AI. pic.twitter.com/ZKaXw5K9sU
— Anthropic (@AnthropicAI) Οκτώβριος 17, 2023
Πολλά LLM που είναι ανοιχτά στο κοινό έχουν αναπτυχθεί με προστατευτικά κιγκλιδώματα - κωδικοποιημένες οδηγίες που υπαγορεύουν συγκεκριμένη συμπεριφορά - σε μια προσπάθεια περιορισμού των ανεπιθύμητων εξόδων. Το Anthropic's Claude και το ChatGPT του OpenAI, για παράδειγμα, δίνουν συνήθως στους χρήστες μια κονσέρβα απόκριση ασφαλείας σε αιτήματα εξόδου που σχετίζονται με βίαια ή αμφιλεγόμενα θέματα.
Ωστόσο, όπως έχουν επισημάνει αναρίθμητοι ειδικοί, τα προστατευτικά κιγκλιδώματα και άλλες επεμβατικές τεχνικές μπορούν να χρησιμεύσουν για να κλέψουν τους χρήστες της εταιρείας τους. Αυτό που θεωρείται αποδεκτό δεν είναι πάντα χρήσιμο και αυτό που θεωρείται χρήσιμο δεν είναι πάντα αποδεκτό. Και οι ορισμοί για την ηθική ή τις αξιακές κρίσεις μπορεί να διαφέρουν μεταξύ πολιτισμών, πληθυσμών και χρονικών περιόδων.
Μια πιθανή λύση για αυτό είναι να επιτραπεί στους χρήστες να υπαγορεύουν την ευθυγράμμιση τιμών για μοντέλα AI. Το πείραμα «Συλλογική Συνταγματική Τεχνητή Νοημοσύνη» της Anthropic είναι ένα μαχαίρι σε αυτήν την «ακατάστατη πρόκληση».
Η Anthropic, σε συνεργασία με το Polis και το Collective Intelligence Project, επισκέφτηκε 1,000 χρήστες σε διάφορα δημογραφικά στοιχεία και τους ζήτησε να απαντήσουν σε μια σειρά ερωτήσεων μέσω δημοσκοπήσεων.
Η πρόκληση επικεντρώνεται στο να επιτρέπεται στους χρήστες η εταιρεία να προσδιορίζει τι είναι κατάλληλο χωρίς να τους εκθέτει σε ακατάλληλα αποτελέσματα. Αυτό περιλάμβανε την προσέλκυση αξιών χρήστη και στη συνέχεια την εφαρμογή αυτών των ιδεών σε ένα μοντέλο που έχει ήδη εκπαιδευτεί.
Το Anthropic χρησιμοποιεί μια μέθοδο που ονομάζεται "Constitutional AI" για να κατευθύνει τις προσπάθειές της να ρυθμίσει τα LLM για ασφάλεια και χρησιμότητα. Ουσιαστικά, αυτό περιλαμβάνει την παροχή στο μοντέλο μιας λίστας κανόνων με τους οποίους πρέπει να συμμορφώνεται και στη συνέχεια την εκπαίδευσή του ώστε να εφαρμόζει αυτούς τους κανόνες σε όλη τη διαδικασία, όπως ένα σύνταγμα λειτουργεί ως το βασικό έγγραφο για τη διακυβέρνηση σε πολλά έθνη.
Στο πείραμα της συλλογικής συνταγματικής τεχνητής νοημοσύνης, η Anthropic προσπάθησε να ενσωματώσει την ανάδραση που βασίζεται σε ομάδες στη δομή του μοντέλου. Τα αποτελέσματα, σύμφωνα με σε μια ανάρτηση ιστολογίου από την Anthropic, φαίνεται ότι ήταν επιστημονική επιτυχία καθώς φώτισε περαιτέρω προκλήσεις για την επίτευξη του στόχου να επιτραπεί στους χρήστες ενός προϊόντος LLM να καθορίσουν τις συλλογικές τους αξίες.
Μία από τις δυσκολίες που έπρεπε να ξεπεράσει η ομάδα ήταν να βρει μια νέα μέθοδο για τη διαδικασία συγκριτικής αξιολόγησης. Καθώς αυτό το πείραμα φαίνεται να είναι το πρώτο του είδους του και βασίζεται στη μεθοδολογία Constitutional AI της Anthropic, δεν υπάρχει καθιερωμένη δοκιμή για τη σύγκριση των βασικών μοντέλων με εκείνα που έχουν συντονιστεί με τιμές που προέρχονται από το πλήθος.
Τελικά, φαίνεται ότι το μοντέλο που εφάρμοσε δεδομένα που προέκυψαν από την ανάδραση των δημοσκοπήσεων των χρηστών ξεπέρασε «ελαφρώς» από το βασικό μοντέλο στην περιοχή των προκατειλημμένων εξόδων.
Σύμφωνα με την ανάρτηση του ιστολογίου:
«Περισσότερο από το μοντέλο που προκύπτει, είμαστε ενθουσιασμένοι με τη διαδικασία. Πιστεύουμε ότι αυτή μπορεί να είναι μία από τις πρώτες περιπτώσεις κατά τις οποίες μέλη του κοινού έχουν, ως ομάδα, σκόπιμα σκηνοθετήσει τη συμπεριφορά ενός μεγάλου γλωσσικού μοντέλου. Ελπίζουμε ότι οι κοινότητες σε όλο τον κόσμο θα βασιστούν σε τεχνικές όπως αυτή για να εκπαιδεύσουν μοντέλα με βάση τον πολιτισμό και το πλαίσιο που εξυπηρετούν τις ανάγκες τους».
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- πηγή: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- :έχει
- :είναι
- $UP
- 000
- 1
- 17
- a
- Σχετικα
- αποδεκτό
- την επίτευξη
- απέναντι
- κατά
- πρακτορείο
- AI
- AI chatbot
- Μοντέλα AI
- ευθυγραμμία
- επιτρέπουν
- Επιτρέποντας
- ήδη
- πάντοτε
- Αμερικανοί
- an
- και
- απάντηση
- Ανθρωπικός
- εμφανίζομαι
- εμφανίζεται
- κατάλληλος
- ΠΕΡΙΟΧΗ
- γύρω
- τεχνητός
- τεχνητή νοημοσύνη
- Τεχνητή νοημοσύνη (AI)
- AS
- At
- απόπειρα
- προσπάθεια
- βάση
- βασίζονται
- BE
- ήταν
- συμπεριφορά
- Πιστεύω
- συγκριτικής αξιολόγησης
- μεταξύ
- μεροληπτική
- Μπλοκ
- χτίζω
- χτισμένο
- by
- που ονομάζεται
- CAN
- Κέντρα
- πρόκληση
- προκλήσεις
- chatbot
- ChatGPT
- Cointelegraph
- συνεργασία
- Συλλογική
- ερχομός
- Κοινοτήτων
- κοινότητα
- συγκρίνοντας
- θεωρούνται
- Σύνταγμα
- αμφιλεγόμενος
- πυρήνας
- ημερομηνία
- ορισμοί
- δημοκρατικός
- Δημογραφικά στοιχεία
- Προσδιορίστε
- αναπτύχθηκε
- Ανάπτυξη
- υπαγόρευση
- δυσκολίες
- κατευθύνθηκε
- διάφορα
- έγγραφο
- κάνει
- προσπάθειες
- κατ 'ουσίαν,
- εγκατεστημένος
- παράδειγμα
- ενθουσιασμένοι
- πείραμα
- ανατροφοδότηση
- Εύρεση
- Εταιρεία
- Όνομα
- Για
- από
- περαιτέρω
- Δώστε
- Δίνοντας
- γκολ
- διακυβέρνησης
- Group
- είχε
- Έχω
- ελπίζω
- HTTPS
- ιδεών
- εφαρμογή
- εφαρμοστεί
- εκτελεστικών
- in
- οδηγίες
- ενσωματώσει
- Νοημοσύνη
- εκ προθέσεως
- σε
- συμμετέχουν
- IT
- ΤΟΥ
- jpg
- κρίσεις
- Είδος
- Γλώσσα
- large
- αφήνοντας
- Μου αρέσει
- LIMIT
- Λιστα
- LLM
- πολοί
- Ενδέχεται..
- εννοώ
- Μέλη
- μέθοδος
- Μεθοδολογία
- μοντέλο
- μοντέλα
- ηθική
- περισσότερο
- πολύ
- πρέπει
- Εθνών
- ανάγκες
- μυθιστόρημα
- Νοέμβριος
- of
- on
- ONE
- Απόψεις
- or
- ΑΛΛΑ
- έξω
- υπερέβησαν
- παραγωγή
- εξόδους
- Ξεπεράστε
- συνεργάστηκε
- έμμηνα
- Μέρος
- προγραμματίζονται
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- δυνατός
- Θέση
- δυναμικού
- διαδικασια μας
- Προϊόν
- σχέδιο
- δημόσιο
- Ερωτήσεις
- σχετίζεται με
- αιτήματα
- απάντησης
- με αποτέλεσμα
- Αποτελέσματα
- ληστεύω
- κανόνες
- Ασφάλεια
- επιστημονικός
- Σειρές
- εξυπηρετούν
- εξυπηρετεί
- συγκεκριμένες
- Μελέτη
- επιτυχία
- Tapped
- στόχος
- τεχνικές
- δοκιμή
- από
- ότι
- Η
- Η περιοχή
- ο κόσμος
- τους
- Τους
- τότε
- Εκεί.
- αυτό
- εκείνοι
- αν και?
- απειλές
- παντού
- ώρα
- προς την
- Θέματα
- προς
- Τρένο
- εκπαιδευμένο
- Εκπαίδευση
- Τουίτερ
- συνήθως
- ανεπιθύμητος
- χρήση
- Χρήστες
- Χρήστες
- χρησιμοποιεί
- χρησιμοποιώντας
- αξία
- με βάση την αξία
- Αξίες
- μέσω
- Ψηφίστε
- ήταν
- we
- Τι
- Ποιό
- θα
- με
- χωρίς
- κόσμος
- zephyrnet