Perché tutti amano ChatGPT Chatbot PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Perché tutti amano il chatbot ChatGPT

Un altro gioco a lungo ritenuto molto impegnativo da conquistare per l'intelligenza artificiale (AI) è toccato ai robot: Stratego.

DeepNash, un'intelligenza artificiale creata da un'azienda con sede a Londra DeepMind, ora abbina umani esperti a Stratego, un gioco da tavolo che richiede un pensiero strategico a lungo termine contro informazioni imperfette.

Quest'ultima impresa arriva sulla scia di un'altra grande vittoria per le IA in giochi precedentemente ritenuti il ​​punto di forza degli umani.

Proprio la scorsa settimana, Cicerone di Meta, un'intelligenza artificiale che può superare in astuzia i giocatori umani al gioco della diplomazia, ha fatto la storia per aver superato in astuzia gli avversari online.

"La velocità con cui caratteristiche di gioco qualitativamente diverse sono state conquistate - o padroneggiate a nuovi livelli - dall'IA negli ultimi anni è piuttosto notevole", afferma Michael Wellman dell'Università del Michigan ad Ann Arbor, un informatico che studia ragionamento strategico e gioco teoria.

"Stratego e Diplomacy sono abbastanza diversi l'uno dall'altro e possiedono anche caratteristiche impegnative notevolmente diverse dai giochi per i quali sono stati raggiunti traguardi analoghi", ha affermato Wellman.

Informazioni imperfette

Il gioco ha caratteristiche generalmente molto più complicate degli scacchi, del Go o del poker. Chess, Go e Poker sono stati tutti dominati dalle IA.

Nel gioco di Stratego, due giocatori mettono 40 pezzi ciascuno su una scacchiera, ma non devono vedere quali sono i pezzi dell'avversario.

L'obiettivo del gioco è spostare i pezzi a turno per eliminare quelli dell'avversario e catturare una bandiera. 

L'albero del gioco di Stratego - un grafico di tutti i possibili modi in cui il gioco potrebbe andare - ha 10535 stati contro i 10360 di Go. 

Quando si tratta di informazioni imperfette all'inizio di una partita, Stratego ha 1066 possibili posizioni private, una cifra che fa impallidire solo 106 di tali situazioni iniziali nel poker Texas hold'em a due giocatori.

"L'assoluta complessità del numero di possibili risultati in Stratego significa che gli algoritmi che funzionano bene nei giochi con informazioni perfette, e anche quelli che funzionano per il poker, non funzionano", afferma Julien Perolat, un ricercatore di DeepMind con sede a Parigi.

DeepNash è stato sviluppato da Perolat e dai suoi colleghi.

Bot ispirato a Nash

Il nome del bot è un tributo al famoso matematico statunitense John Nash, che ha inventato la teoria dell'equilibrio di Nash che presuppone che ci sia un "insieme stabile di strategie" che può essere seguito dai giocatori in modo tale che nessun giocatore tragga vantaggio cambiando strategia da soli. Pertanto, i giochi tendono ad avere zero, uno o più equilibri di Nash.

DeepNash combina un algoritmo di apprendimento per rinforzo e una rete neurale profonda per trovare un equilibrio di Nash. 

In generale, l'apprendimento per rinforzo è dove un agente intelligente (programma per computer) interagisce con l'ambiente e apprende la migliore politica per dettare l'azione per ogni stato di un gioco. 

Per avere una politica ottimale, DeepNash ha giocato un totale di 5.5 miliardi di partite contro se stessa. 

In sostanza, se una parte viene penalizzata, l'altra viene premiata e le variabili della rete neurale, che rappresentano la politica, vengono modificate di conseguenza.

L'intelligenza artificiale batte gli umani in Stratego: scopri DeepMash

L'intelligenza artificiale batte gli umani in Stratego: scopri DeepMash

Ad un certo punto, DeepNash converge su un approssimato equilibrio di Nash. A differenza di altri Bot, DeepNash si ottimizza senza scercando attraverso l'albero del gioco.

Per una durata di due settimane, DeepNash ha giocato contro giocatori umani di Stratego sulla piattaforma di giochi online Gravon.

Dopo aver partecipato a 50 partite, l'Ai si è classificato terzo tra tutti i giocatori di Gravon Stratego dal 2002. 

"Il nostro lavoro mostra che un gioco così complesso come Stratego, che coinvolge informazioni imperfette, non richiede tecniche di ricerca per risolverlo", afferma il membro del team Karl Tuyls, un ricercatore di DeepMind con sede a Parigi. "Questo è davvero un grande passo avanti nell'IA".

Anche altri ricercatori sono rimasti colpiti da questa impresa.

Risultati impressionanti

"I risultati sono impressionanti", concorda Noam Brown, ricercatore presso Meta AI, con sede a New York City, e membro del team che nel 2019 ha segnalato il giocatore di poker AI Pluribus4.

A Meta, la società madre di Facebook, Brown e i suoi colleghi hanno costruito un'intelligenza artificiale in grado di giocare a Diplomacy, un gioco in cui sette giocatori competono per il controllo geografico dell'Europa spostando i pezzi su una mappa.

In Diplomazia, l'obiettivo è prendere il controllo dei centri di rifornimento spostando le unità (flotte ed eserciti). 

Meta afferma che Cicerone è piuttosto significativo perché l'intelligenza artificiale si basa su ambienti non contraddittori.

A differenza del passato, dove i maggiori successi precedenti per l'IA multi-agente sono stati in ambienti puramente contraddittori, come scacchi, go e poker, dove la comunicazione non ha valore, Cicero utilizza un motore di ragionamento strategico e un modulo di dialogo controllabile.

"Quando vai oltre i giochi a somma zero per due giocatori, l'idea dell'equilibrio di Nash non è più così utile per giocare bene con gli umani", afferma Brown.

Brown e il suo team hanno addestrato Cicerone utilizzando i dati di 125,261 partite di una versione online di Diplomacy che coinvolgeva giocatori umani. 

Utilizzando i dati di auto-gioco e un modulo di ragionamento strategico (SRM), Cicero ha imparato a prevedere il giudizio in base allo stato del gioco e ai messaggi accumulati, le probabili mosse e le politiche degli altri giocatori. 

L'intelligenza artificiale batte gli umani in Stratego: scopri DeepMash

L'intelligenza artificiale batte gli umani in Stratego: scopri DeepMash

Meta afferma di aver raccolto dati da 125,261 partite di Diplomacy giocate online su webDiplomacy.net. Di questi giochi, un totale di 40,408 giochi contenevano dialoghi, con un totale di 12,901,662 messaggi scambiati tra i giocatori.

Comportamento nel mondo reale

Brown crede che i robot di gioco come Cicero possano interagire con gli umani e tenere conto di "azioni umane non ottimali o addirittura irrazionali potrebbero aprire la strada ad applicazioni del mondo reale".

"Se stai realizzando un'auto a guida autonoma, non vuoi dare per scontato che tutti gli altri conducenti sulla strada siano perfettamente razionali e si comporteranno in modo ottimale", afferma.

Cicerone, aggiunge, è un grande passo in questa direzione. "Abbiamo ancora un piede nel mondo di gioco, ma ora abbiamo un piede anche nel mondo reale".

Altri come Wellman sono d'accordo, ma insistono che c'è ancora molto lavoro da fare. "Molte di queste tecniche sono davvero rilevanti al di là dei giochi ricreativi" per le applicazioni del mondo reale, afferma. "Tuttavia, a un certo punto, i principali laboratori di ricerca sull'intelligenza artificiale devono andare oltre le impostazioni ricreative e capire come misurare i progressi scientifici sui 'giochi' del mondo reale più delicati a cui teniamo davvero".

/MetaNotizie.

Timestamp:

Di più da MetaNotizie