ChatGPT trova un ruolo giocando a Dungeons & Dragons

ChatGPT trova un ruolo giocando a Dungeons & Dragons

Boffins ha trovato un ruolo per i chatbot di intelligenza artificiale in cui l'allucinazione abituale non è necessariamente una responsabilità.

Queste teste d'uovo, con sede presso l'Università della Pennsylvania e l'Università del Maryland negli Stati Uniti, hanno utilizzato i modelli linguistici di grandi dimensioni (LLM) di OpenAI per aiutarli con i giochi di ruolo fantasy, in particolare Dungeons & Dragons (D&D).

In un carta prestampata intitolato "CALYPSO: LLM come assistenti dei Dungeon Masters", Andrew Zhu, uno studente di dottorato dell'UPenn; Lara Martin, assistente professore all'UMD; Andrew Head, assistente professore alla UPenn; e Chris Callison-Burch, professore associato presso UPenn, spiegano come hanno utilizzato gli LLM per migliorare un gioco che dipende fortemente dall'interazione umana.

D&D è apparso per la prima volta nel 1974 come gioco di ruolo (RPG) in cui i giocatori assumevano i ruoli di eroi medievali avventurosi e recitavano quelle personalità sotto una trama diretta da un dungeon master (DM) o game master (GM). I prerequisiti erano una serie di regole - pubblicate all'epoca da Tactical Studies Rules - dadi poliedrici, matita, carta e un impegno condiviso per la narrazione interattiva e una modesta teatralità. Gli spuntini, tecnicamente facoltativi, dovrebbero essere assunti.

Accanto a questo gioco di ruolo da tavolo, la proliferazione dei personal computer negli anni '1980 ha portato a varie versioni computerizzate, sia in termini di gioco assistito dal computer che di simulazioni interamente elettroniche - come il recente rilascio Baldur's Gate 3, per citare solo uno delle centinaia di titoli ispirati a D&D e altri giochi di ruolo.

I giocatori accademici di UPenn e UMD hanno deciso di vedere come gli LLM potrebbero supportare i DM umani, che sono responsabili di impostare la scena in cui si svolge l'avventura immaginata reciprocamente, di lanciare i dadi che determinano i risultati di determinate azioni, di far rispettare le regole ( che sono diventati piuttosto estesi) e in generale per garantire che l'esperienza sia divertente e divertente.

Per fare ciò, hanno creato un set di tre interfacce basate su LLM, chiamate CALYPSO, che sta per Collaborative Assistant for Lore and Yielding Plot Synthesis Objectives. È progettato per giocare a D&D online tramite Discord, il popolare servizio di chat.

"Quando hanno avuto accesso a CALYPSO, i DM hanno riferito che generava testo ad alta fedeltà adatto per la presentazione diretta ai giocatori e idee a bassa fedeltà che il DM poteva sviluppare ulteriormente mantenendo la propria agenzia creativa", spiega il documento. "Vediamo CALYPSO come un esempio di un paradigma di strumenti potenziati dall'intelligenza artificiale che forniscono assistenza creativa sincrona all'interno di mondi di gioco consolidati e giochi da tavolo più in generale."

La pandemia di COVID-19 ha spostato online alcuni giochi da tavolo di persona, osservano i ricercatori nel loro articolo, e molti giocatori che giocano tramite Discord lo fanno con Avrae – un robot Discord progettato da Andrew Zhu, uno studente di dottorato UPenn e coautore dell'articolo CALYPSO.

“Le idee fondamentali del documento (che i LLM sono in grado di agire come co-DM in modi che aiutano a ispirare il DM umano senza assumere il controllo creativo del gioco) si applicano a D&D e ad altri giochi da tavolo indipendentemente dalla modalità. Ma ci sono ancora alcune sfide da superare prima di applicare la tecnologia ai giochi di persona ", ha affermato Zhu in una e-mail a Il registro.

Zhu e i suoi colleghi si sono concentrati sui giochi Discord play-by-post (PBP) per diversi motivi. Innanzitutto, "il PBP basato su Discord è già basato sul testo, quindi non dobbiamo perdere tempo a trascrivere il discorso in testo per un LLM", ha spiegato.

La configurazione online consente inoltre al DM di visualizzare privatamente l'output generato da LLM (dove le "idee a bassa fedeltà" contano meno) e libera il DM dall'obbligo di digitare o dettare in un'interfaccia.

CALIPSO, a Discordia bot con codice sorgente, è descritto nel documento come dotato di tre interfacce: una per generare il testo di configurazione che descrive un incontro (GPT-3); uno per il brainstorming mirato, in cui il DM può porre domande all'LLM su un incontro o perfezionare un riepilogo dell'incontro (ChatGPT); e uno per la chat a dominio aperto, in cui i giocatori possono interagire direttamente con ChatGPT agendo come una creatura fantastica informata su D&D.

Immagine dell'output del bot CALYPSO

Immagine dell'output del bot CALYPSO (fare clic per ingrandire)

La configurazione di queste interfacce ha comportato il seeding dell'LLM con prompt specifici (dettagliati nel documento) che spiegano come il chatbot dovrebbe rispondere in ciascun ruolo dell'interfaccia. Non è stato richiesto alcun addestramento specifico del modello per incorporare il funzionamento di D&D.

"Abbiamo scoperto che anche senza addestramento, la serie di modelli GPT sa molto di D&D avendo visto libri di origine e discussioni su Internet nei suoi dati di addestramento", ha affermato Zhu.

Abbiamo scoperto che anche senza formazione, la serie di modelli GPT sa molto su D&D avendo visto libri di origine e discussioni su Internet

Zhu e i suoi colleghi hanno testato CALYPSO con 71 giocatori e DM, quindi li hanno intervistati sull'esperienza. Hanno trovato l'aiutante AI utile il più delle volte.

Ma c'era spazio per miglioramenti. Ad esempio, in un incontro, CALYPSO ha semplicemente parafrasato le informazioni nell'impostazione e nel prompt delle statistiche, che i DM ritenevano non aggiungessero valore.

Il registro ha chiesto a Zhu se la tendenza degli LLM ad "allucinare" - inventare le cose - fosse un problema per i partecipanti allo studio.

“In un contesto creativo, diventa un po' meno significativo – per esempio, i libri di riferimento di D&D non contengono tutti i dettagli su ogni mostro, quindi se un LLM afferma che un certo mostro ha una certa pelliccia colorata, conta come un'allucinazione? ?” disse Zhu.

“Per rispondere direttamente alla domanda, sì; il modello spesso "inventa" fatti sui mostri che non sono nei libri di origine. La maggior parte di queste sono cose banali che in realtà aiutano il DM, come il suono del richiamo di un mostro o la forma dell'iride di un mostro o cose del genere. A volte, meno spesso, allucina fatti più drastici, come dire che le salamandre del gelo hanno le ali (non le hanno).

Un altro problema che è emerso è che le misure di salvaguardia dell'addestramento dei modelli a volte interferivano con la capacità di CALYPSO di discutere questioni che sarebbero state appropriate in un gioco di D&D, come la razza e il gameplay.

"Ad esempio, il modello a volte si rifiutava di suggerire razze (fantastiche), probabilmente a causa degli sforzi per ridurre il potenziale di pregiudizi razziali nel mondo reale", osserva il documento. "In un altro caso, il modello insiste sul fatto che non è in grado di giocare a D&D, probabilmente a causa degli sforzi per impedire al modello di rivendicare abilità che non possiede."

(Sì, siamo sicuri che alcuni di noi ci siano già stati, negando qualsiasi conoscenza dei giochi di ruolo nonostante anni di gioco.)

Zhu ha detto che è chiaro che le persone non vogliono un DM AI, ma sono più disposte a consentire ai DM di appoggiarsi all'aiuto dell'IA.

"Durante i nostri studi formativi un tema comune era che le persone non volevano un DM AI autonomo, per un paio di motivi", ha spiegato. “In primo luogo, molti dei giocatori che abbiamo intervistato avevano già giocato con strumenti come AI Dungeon e conoscevano i punti deboli dell'IA nella narrazione a lungo contesto. In secondo luogo, e cosa più importante, hanno espresso che avere un DM AI autonomo avrebbe tolto lo spirito del gioco; dal momento che D&D è un gioco di narrazione creativa nel cuore, avere un'intelligenza artificiale che genera quella storia sembrerebbe sbagliato.

“Il fatto che CALYPSO fosse una cosa opzionale che i DM potevano scegliere di usare tanto o poco quanto volevano aiutava a mantenere la palla creativa nel campo del DM umano; spesso ciò che accadrebbe è che CALYPSO darebbe al DM una spinta quanto basta per liberarlo da una routine del blocco dello scrittore o semplicemente fornire loro un elenco di idee da cui partire. Una volta che il DM umano sentiva di volere un maggiore controllo sulla scena, poteva semplicemente continuare a fare DM nel proprio stile senza usare affatto CALYPSO. ®

Timestamp:

Di più da Il registro