Η νέα τεχνητή νοημοσύνη της Meta κατατάχθηκε στο κορυφαίο 10% στο παιχνίδι «Diplomacy»—και οι άνθρωποι δεν ήταν κανένας από τη σοφότερη ευφυΐα δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Το νέο AI της Meta κατατάχθηκε στο κορυφαίο 10% στο παιχνίδι «Diplomacy»—και οι άνθρωποι δεν ήταν πιο σοφοί

Το AI έχει κατακτήσει μερικά από τα περισσότερα πολύπλοκα παιχνίδια γνωστό στον άνθρωπο, αλλά ενώ συχνά υπερέχει στον ανταγωνισμό, η συνεργασία δεν είναι τόσο φυσιολογική. Τώρα μια τεχνητή νοημοσύνη από τη Meta έχει κατακτήσει το παιχνίδι Diplomacy, το οποίο απαιτεί από εσάς να συνεργαστείτε με άλλους παίκτες για να κερδίσετε.

Η μαεστρία της Google στο παιχνίδι του Go χαιρετίστηκε ως σημαντικό ορόσημο για την τεχνητή νοημοσύνη, αλλά παρά την αναμφισβήτητη πολυπλοκότητά της, είναι από πολλές απόψεις κατάλληλη για την ψυχρή, υπολογιστική λογική μιας μηχανής. Είναι ένα παιχνίδι τέλειας πληροφόρησης, όπου έχετε πλήρη ορατότητα των κινήσεων του αντιπάλου σας και η νίκη σημαίνει απλώς ότι μπορείτε να ξεπεράσετε έναν άλλο παίκτη.

Η διπλωματία, από την άλλη πλευρά, είναι πολύ πιο μπερδεμένη υπόθεση. Το επιτραπέζιο παιχνίδι βλέπει έως και επτά παίκτες να παίρνουν επί ευρωπαϊκές στρατιωτικές δυνάμεις και χρησιμοποιούν τους στρατούς τους για να πάρουν τον έλεγχο στρατηγικών πόλεων. Αλλά οι παίκτες επιτρέπεται να διαπραγματεύονται μεταξύ τους για να σχηματίσουν και να σπάσουν συμμαχίες επιδιώκοντας την απόλυτη κυριαρχία.

Επιπλέον, όλες οι κινήσεις των παικτών γίνονται ταυτόχρονα σε κάθε στροφή, έτσι δεν μπορείτε απλά να αντιδράτε σε αυτό που κάνουν οι άλλοι. Αυτό σημαίνει ότι η νίκη σε παιχνίδια απαιτεί έναν περίπλοκο συνδυασμό στρατηγικής σκέψης, ικανότητα συνεργασίας με άλλους παίκτες και πειστικές διαπραγματευτικές δεξιότητες. Ενώ η τεχνητή νοημοσύνη έχει ήδη κατακτήσει την καθαρή στρατηγική, αυτές οι άλλες δεξιότητες έχουν αποδειχθεί πολύ πιο δύσκολο να αναπαραχθούν.

Ωστόσο, μια νέα τεχνητή νοημοσύνη που σχεδιάστηκε από ερευνητές στο Meta μπορεί να έχει κάνει ένα μεγάλο βήμα προς αυτή την κατεύθυνση. Σε ένα δημοσιευμένο έγγραφο την περασμένη εβδομάδα in Επιστήμη, περιγράφουν ένα σύστημα που ονομάζεται Cicero που κατατάχθηκε στο κορυφαίο 10 τοις εκατό των παικτών σε ένα διαδικτυακό πρωτάθλημα Διπλωματίας και πέτυχε περισσότερο από το διπλάσιο του μέσου όρου βαθμολογίας των ανθρώπινων παικτών.

"Ο Κικέρων είναι ανθεκτικός, είναι αδίστακτος και είναι υπομονετικός», ο τρεις φορές παγκόσμιος πρωταθλητής της Διπλωματίας Andrew Goff sa.id σε ένα βίντεο παραγωγής Meta. «Παίζει χωρίς πολύ ανθρώπινο συναίσθημα που μερικές φορές σε κάνει να παίρνεις κακές αποφάσεις. Απλώς αξιολογεί την κατάσταση και παίρνει την καλύτερη απόφαση, όχι μόνο για αυτήν, αλλά και για τους ανθρώπους με τους οποίους συνεργάζεται».

Η δημιουργία του Cicero απαιτούσε από τους ερευνητές της Meta να συνδυάσουν μεθόδους τεχνητής νοημοσύνης αιχμής από δύο διαφορετικά υποπεδία: τη στρατηγική συλλογιστική και την επεξεργασία φυσικής γλώσσας. Στην καρδιά του, το σύστημα έχει έναν αλγόριθμο σχεδιασμού που προβλέπει τις κινήσεις άλλων παικτών και το χρησιμοποιεί για να καθορίσει τη δική του στρατηγική. Αυτός ο αλγόριθμος εκπαιδεύτηκε κάνοντας το AI να παίζει τον εαυτό του ξανά και ξανά, προσπαθώντας επίσης να μιμηθεί τον τρόπο με τον οποίο οι άνθρωποι παίζουν το παιχνίδι.

Οι ερευνητές είχαν ήδη δείξει ότι αυτή η ενότητα προγραμματισμού από μόνη της ήταν σε θέση νικήσει τους ανθρώπους πλεονεκτήματα σε μια απλοποιημένη έκδοση του παιχνιδιού. Αλλά σε αυτήν την τελευταία έρευνα, η ομάδα το συνδύασε με ένα μεγάλο γλωσσικό μοντέλο εκπαιδευμένο σε τεράστιες ποσότητες κειμένου από το Διαδίκτυο και στη συνέχεια βελτιστοποιήθηκε χρησιμοποιώντας διάλογο από 40,000 διαδικτυακά παιχνίδια της Διπλωματίας. Αυτό έδωσε στον αναβαθμισμένο Cicero τη δυνατότητα να ερμηνεύει και τα δύο μηνύματα από άλλους παίκτες και κατασκευάζει επίσης τη δική του μηνύματα για να τους πείσει να συνεργαστούν.

Το συνδυασμένο σύστημα ξεκινά χρησιμοποιώντας την τρέχουσα κατάσταση του ταμπλό και τον προηγούμενο διάλογο για να προβλέψει τι είναι πιθανό να κάνει κάθε παίκτης. Στη συνέχεια, καταρτίζει ένα σχέδιο δράσης τόσο για την ίδια όσο και για τους εταίρους της προτού δημιουργήσει μηνύματα που έχουν σχεδιαστεί για να περιγράψουν την πρόθεσή της και να εξασφαλίσουν τη συνεργασία των άλλων παικτών.

Πάνω από 40 παιχνίδια στο διαδικτυακό τουρνουά, ο Κικέρων επικοινώνησε αποτελεσματικά με 82 άλλους παίκτες για να εξηγήσει τις προθέσεις του, να συντονίσει τις ενέργειες και να διαπραγματευτεί συμμαχίες. Το κρίσιμο είναι ότι οι ερευνητές λένε ότι δεν είδαν στοιχεία από μηνύματα εντός του παιχνιδιού που να υποψιάζονταν ότι οι παίκτες συνεργάζονταν με μια τεχνητή νοημοσύνη.

Ωστόσο, οι επικοινωνιακές ικανότητες του μοντέλου δεν ήταν άψογες. Είναι κάτι παραπάνω από ικανό να βγάζει ανόητα μηνύματα ή μηνύματα που δεν συνάδουν με τους στόχους του, έτσι οι ερευνητές έπρεπε να δημιουργήσουν πολλαπλά υποψήφια μηνύματα σε κάθε κίνηση και στη συνέχεια να χρησιμοποιήσουν διάφορους μηχανισμούς φιλτραρίσματος για να απομακρύνουν τα σκουπίδια. Και ακόμη και τότε, οι ερευνητές παραδέχονται ότι τα παράλογα μηνύματα μερικές φορές γλιστρούνped διά μέσου.

Αυτό υποδηλώνει ότι το γλωσσικό μοντέλο στην καρδιά του Κικέρωνα εξακολουθεί να μην καταλαβαίνει πραγματικά τι συμβαίνει και απλώς παράγει εύλογα μηνύματα που στη συνέχεια πρέπει να ελεγχθούν για να βεβαιωθείτε ότι επιτυγχάνουν τα επιθυμητά αποτελέσματα.

Γράφοντας Η Συνομιλία, Ο ερευνητής τεχνητής νοημοσύνης Toby Walsh στο Πανεπιστήμιο της Νέας Νότιας Ουαλίας στην Αυστραλία σημειώνει επίσης ότι ο Κικέρων είναι αλάνθαστα ειλικρινής, σε αντίθεση με τους περισσότερους ανθρώπινους παίκτες. Αν και αυτή είναι μια εκπληκτικά αποτελεσματική στρατηγική, θα μπορούσε να είναι μια σημαντική αδυναμία εάν οι ανταγωνιστές καταλάβουν ότι ο αντίπαλός τους δεν πρόκειται ποτέ να προσπαθήσει να τους εξαπατήσει.

Η πρόοδος είναι, ωστόσο, σημαντική και το Facebook ελπίζει ότι θα μπορούσε να έχει εφαρμογές πολύ πέρα ​​από τα επιτραπέζια παιχνίδια. Σε μια θέση blog, οι ερευνητές λένε ότι η δυνατότητα χρήσης αλγορίθμων προγραμματισμού για τον έλεγχο της παραγωγής γλώσσας θα μπορούσε να καταστήσει δυνατή την πραγματοποίηση πολύ μακρότερων και πλουσιότερων συνομιλιών με chatbots AI ή τη δημιουργία χαρακτήρων βιντεοπαιχνιδιών που μπορούν να προσαρμοστούν στη συμπεριφορά ενός παίκτη.

Image Credit: MabelAmber / 4008 εικόνες

Σφραγίδα ώρας:

Περισσότερα από Κέντρο μοναδικότητας