ChatGPT finder en rollespil Dungeons & Dragons

ChatGPT finder en rollespil Dungeons & Dragons

Boffins har fundet en rolle for AI-chatbots, hvor sædvanlige hallucinationer ikke nødvendigvis er et ansvar.

De æggehoveder – baseret på University of Pennsylvania og University of Maryland i USA – hyrede OpenAI's store sprogmodeller (LLM'er) til at hjælpe med fantasy-rollespil, specifikt Dungeons & Dragons (D&D).

I en fortrykt papir med titlen "CALYPSO: LLMs as Dungeon Masters' Assistants," Andrew Zhu, en UPenn ph.d.-studerende; Lara Martin, adjunkt ved UMD; Andrew Head, assisterende professor ved UPenn; og Chris Callison-Burch, lektor ved UPenn, forklarer, hvordan de brugte LLM'er til at forbedre et spil, der i høj grad afhænger af menneskelig interaktion.

D&D dukkede første gang op i 1974 som et rollespil (RPG), hvor spillere påtog sig rollerne som eventyrlystne middelalderhelte og udspillede disse personligheder under en historie instrueret af en dungeon master (DM) eller game master (GM). Forudsætningerne var et sæt regler - udgivet på det tidspunkt af Tactical Studies Rules - polyedriske terninger, blyant, papir og en fælles forpligtelse til interaktiv historiefortælling og beskeden teater. Snacks, teknisk valgfrit, bør antages.

Sideløbende med et sådant bordrollespil førte udbredelsen af ​​personlige computere i 1980'erne til forskellige computeriserede versioner, både hvad angår computerstøttet spil og helt elektroniske simuleringer - som den nyligt udgivne Baldur's Gate 3, for blot at nævne en af ​​hundredvis af titler inspireret af D&D og andre RPG'er.

De akademiske spillere fra UPenn og UMD satte sig for at se, hvordan LLM'er kunne støtte menneskelige DM'er, som er ansvarlige for at sætte scenen for, hvor det gensidigt forestillede eventyr finder sted, for at kaste terningerne, der bestemmer udfaldet af visse handlinger, for at håndhæve reglerne ( som er blevet ret omfattende), og for generelt at sikre, at oplevelsen er sjov og underholdende.

For at gøre det skabte de et sæt af tre LLM-drevne grænseflader, kaldet CALYPSO – som står for Collaborative Assistant for Lore and Yielding Plot Synthesis Objectives. Den er designet til at spille D&D online gennem Discord, den populære chattjeneste.

"Da de fik adgang til CALYPSO, rapporterede DM'ere, at det genererede high-fidelity-tekst, der var egnet til direkte præsentation for spillere, og low-fidelity-ideer, som DM'erne kunne udvikle yderligere og samtidig bevare deres kreative bureau," forklarer avisen. "Vi ser CALYPSO som et eksempel på et paradigme af AI-augmenterede værktøjer, der giver synkron kreativ assistance inden for etablerede spilverdener og bordspil mere bredt."

COVID-19-pandemien flyttede noget personligt bordspil online, observerer forskerne i deres papir, og mange spillere, der spiller via Discord, gør det med Avrae – en Discord-bot designet af Andrew Zhu, en UPenn ph.d.-studerende og en medforfatter af CALYPSO papiret.

"Kerneideerne i papiret (at LLM'er er i stand til at fungere som en co-DM på måder, der hjælper med at inspirere den menneskelige DM uden at overtage kreativ kontrol over spillet) gælder for D&D og andre bordspil uanset modalitet. Men der er stadig nogle udfordringer, der skal overvindes, før man anvender teknologien til personligt spil,” sagde Zhu i en e-mail til Registret.

Zhu og hans kolleger fokuserede på Discord play-by-post (PBP) spil af flere årsager. For det første: "Discord-baseret PBP er allerede tekstbaseret, så vi behøver ikke bruge tid på at transskribere tale til tekst til en LLM," forklarede han.

Online-opsætningen tillader også DM at se LLM-genereret output privat (hvor "low-fidelity ideer" betyder mindre), og det frigør DM fra at skulle skrive eller diktere i en eller anden grænseflade.

CALYPSO, en Discord bot med kildekode, er beskrevet i papiret som havende tre grænseflader: en til generering af opsætningsteksten, der beskriver et møde (GPT-3); en til fokuseret brainstorming, hvor DM kan bede LLM om spørgsmål om et møde eller forfine et møderesumé (ChatGPT); og en til chat med åbent domæne, hvor spillere kan engagere sig direkte med ChatGPT, der fungerer som et fantasivæsen, der kender til D&D.

Billede af CALYPSO bot-output

Billede af CALYPSO bot-output (klik for at forstørre)

Opsætningen af ​​disse grænseflader indebar, at LLM'et blev set med specifikke prompter (detaljeret i papiret), der forklarer, hvordan chatbotten skal reagere i hver grænsefladerolle. Der krævedes ingen specifik modeluddannelse for at inkorporere, hvordan D&D fungerer.

"Vi fandt ud af, at selv uden træning ved GPT-serien af ​​modeller meget om D&D fra at have set kildebøger og internetdiskussioner i deres træningsdata," sagde Zhu.

Vi fandt ud af, at selv uden træning ved GPT-serien af ​​modeller meget om D&D fra at have set kildebøger og internetdiskussioner

Zhu og hans kolleger testede CALYPSO med 71 spillere og DM'er og undersøgte dem derefter om oplevelsen. De fandt AI-hjælperen nyttig oftere end ikke.

Men der var plads til forbedringer. For eksempel, i et møde, parafraserede CALYPSO blot information i indstillingen og statistikprompten, som DM'ere mente ikke tilførte værdi.

Registret spurgte Zhu om, hvorvidt LLM'ers tendens til at "hallucinere" - finde på ting - var et problem for deltagerne i undersøgelsen.

"I en kreativ sammenhæng bliver det lidt mindre meningsfuldt – for eksempel indeholder D&D opslagsbøgerne ikke alle detaljer om hvert monster, så hvis en LLM hævder, at et bestemt monster har en bestemt farvet pels, tæller det som en hallucination ?” sagde Zhu.

“For at svare direkte på spørgsmålet, ja; modellen 'opfinder' ofte fakta om monstre, der ikke er i kildebøgerne. De fleste af disse er trivielle ting, der rent faktisk hjælper DM, som hvordan et monsters opkald lyder eller formen på et monsters iris eller sådan noget. Nogle gange, sjældnere, hallucinerer det mere drastiske fakta, som at sige frostsalamandre har vinger (det har de ikke)."

Et andet problem, der dukkede op, var, at sikkerhedsforanstaltninger til modeltræning nogle gange forstyrrede CALYPSO's evne til at diskutere spørgsmål, der ville være passende i et D&D-spil – som race og gameplay.

"For eksempel ville modellen nogle gange nægte at foreslå (fantasi)racer, sandsynligvis på grund af bestræbelser på at reducere potentialet for racemæssige skævheder i den virkelige verden," bemærker avisen. "I et andet tilfælde insisterer modellen på, at den ikke er i stand til at spille D&D, sandsynligvis på grund af bestræbelser på at forhindre, at modellen fremsætter krav om evner, den ikke besidder."

(Ja, vi er sikre på, at nogle af os har været der før, og nægter ethvert kendskab til RPG'er på trods af mange års spil.)

Zhu sagde, at det er klart, at folk ikke vil have en AI DM, men de er mere villige til at tillade DM'ere at støtte sig til AI-hjælp.

"Under vores formative undersøgelser var et fælles tema, at folk ikke ønskede en autonom AI DM af et par grunde," forklarede han. "For det første havde mange af de spillere, vi interviewede, allerede leget med værktøjer som AI Dungeon og var bekendt med AI's svagheder i historiefortælling i lang sammenhæng. For det andet, og endnu vigtigere, gav de udtryk for, at det ville tage væk fra spillets ånd at have en autonom AI DM; da D&D er et kreativt fortællespil i bund og grund, ville det føles forkert at have en AI til at generere den historie.

"At have CALYPSO til at være en valgfri ting, som DM'ere kunne vælge at bruge så meget eller så lidt, som de ville, hjalp med at holde den kreative bold på den menneskelige DM's bane; Det, der ofte ville ske, er, at CALYPSO ville give DM lige et skub nok til at bryde dem ud af en skribentblokering eller bare give dem en liste over ideer at bygge videre på. Når først den menneskelige DM følte, at de ville have mere kontrol over scenen, kunne de bare fortsætte DMing i deres egen stil uden overhovedet at bruge CALYPSO." ®

Tidsstempel:

Mere fra Registret