Meta’s New AI Ranked In The Top 10% At The Game ‘Diplomacy’

Republicat de Platon

Urmaritori: 0

AI a stăpânit pe unele dintre cele mai multe jocuri complexe cunoscută omului, dar deși excelează adesea la competiție, cooperarea nu vine la fel de naturală. Acum, un AI de la Meta a stăpânit jocul Diplomacy, care vă cere să lucrați cu alți jucători pentru a câștiga.

Stăpânirea de către Google a jocul Go a fost salutată ca o piatră de hotar majoră pentru AI, dar în ciuda complexității sale incontestabile, este în multe privințe potrivită pentru logica rece și calculatoare a unei mașini. Este un joc de informații perfecte, în care ai vizibilitate deplină a mișcărilor adversarului tău, iar câștigul înseamnă pur și simplu să poți depăși un alt jucător.

Diplomația, pe de altă parte, este o chestiune mult mai dezordonată. Jocul de masă vede până la șapte jucători să ia peste Puterile militare europene și își folosesc armatele pentru a prelua controlul asupra orașelor strategice. Dar jucătorilor li se permite să negocieze între ei pentru a forma și rupe alianțe în căutarea unei dominații totale.

Mai mult decât atât, toate mișcările jucătorilor sunt făcute simultan la fiecare tură, așa că nu poți reacționa pur și simplu la ceea ce fac alții. Acest lucru înseamnă că jocurile câștigătoare necesită o combinație complexă de gândire strategică, capacitatea de a coopera cu alți jucători și abilități persuasive de negociere. În timp ce AI a stăpânit deja strategia pură, acele alte abilități s-au dovedit mult mai dificil de reprodus.

Totuși, un nou AI conceput de cercetătorii de la Meta ar fi făcut un pas mare în această direcție. Într-o lucrare publicată săptămâna trecută in Ştiinţă, ei descriu un sistem numit Cicero care s-a clasat în top 10 la sută dintre jucători dintr-o ligă online de diplomație și a obținut mai mult de două ori scorul mediu al jucătorilor umani.

Cicero este rezistent, nemilos și răbdător”, a declarat Andrew Goff, de trei ori campion mondial la Diplomație.id într-un videoclip produs de Meta. „Se joacă fără prea multă emoție umană care uneori te face să iei decizii proaste. Doar evaluează situația și ia cea mai bună decizie, nu numai pentru ea, ci și pentru oamenii cu care lucrează.”

Crearea lui Cicero a cerut cercetătorilor Meta să combine metodele AI de ultimă generație din două subdomeni diferite: raționamentul strategic și procesarea limbajului natural. În centrul său, sistemul are un algoritm de planificare care prezice mișcările altor jucători și îl folosește pentru a-și determina propria strategie. Acest algoritm a fost antrenat prin a face AI să se joace singur, iar și iar, încercând în același timp să imite modul în care oamenii joacă jocul.

Cercetătorii au arătat deja că acest modul de planificare singur a fost capabil învinge profesioniștii umani într-o versiune simplificată a jocului. Însă, în această ultimă cercetare, echipa a combinat-o cu un model lingvistic mare antrenat pe cantități mari de text de pe internet și apoi a optimizat folosind dialogul din 40,000 de jocuri online de Diplomație. Acest lucru i-a oferit lui Cicero abilitatea de a interpreta atât mesajele de la alți jucători și de asemenea, crează propria sa mesaje pentru a-i convinge să lucreze împreună.

Sistemul combinat începe prin utilizarea stării curente a tablei și a dialogului trecut pentru a prezice ce va face fiecare jucător. Apoi vine cu un plan de acțiune atât pentru sine, cât și pentru partenerii săi, înainte de a genera mesaje menite să-și sublinieze intenția și să asigure cooperarea celorlalți jucători.

Peste 40 de jocuri din turneul online, Cicero a comunicat eficient cu alți 82 de jucători pentru a-și explica intențiile, a coordona acțiunile și a negocia alianțe. În mod crucial, cercetătorii spun că nu au văzut nicio dovadă din mesajele din joc că jucătorii umani ar fi bănuit că fac echipă cu o IA.

Cu toate acestea, abilitățile de comunicare ale modelului nu au fost impecabile. Este mai mult decât capabil să scuipe mesaje fără sens sau neconforme cu obiectivele sale, așa că cercetătorii au trebuit să genereze mai multe mesaje candidate la fiecare mișcare și apoi să folosească diferite mecanisme de filtrare pentru a îndepărta gunoiul. Și chiar și atunci, cercetătorii admit că mesajele ilogice alunecă uneoriPED prin.

Acest lucru sugerează că modelul lingvistic din inima lui Cicero încă nu înțelege cu adevărat ce se întâmplă și pur și simplu produce mesaje cu sunet plauzibil care apoi trebuie verificate pentru a se asigura că obțin rezultatele dorite.

Înscriere în Conversaţie, Cercetătorul AI Toby Walsh de la Universitatea din New South Wales din Australia observă, de asemenea, că Cicero este sincer, spre deosebire de majoritatea jucătorilor umani. Deși aceasta este o strategie surprinzător de eficientă, ar putea fi o slăbiciune majoră dacă concurenții își dau seama că adversarul lor nu va încerca niciodată să-i înșele.

Avansul este, totuși, unul semnificativ, iar Facebook speră că ar putea avea aplicații mult dincolo de jocurile de societate. Într-un post pe blog, cercetătorii spun că abilitatea de a folosi algoritmi de planificare pentru a controla generarea limbajului ar putea face posibilă conversații mult mai lungi și mai bogate cu chatbot-uri AI sau crearea de personaje de jocuri video care se pot adapta la comportamentul unui jucător.

Credit imagine: MabelAmber / 4008 imagini

Timestamp-ul: Noiembrie 28, 2022Noiembrie 28, 2022

Timestamp-ul: Mar 1, 2024

Noua inteligență artificială a lui Meta s-a clasat în Top 10% la jocul „Diplomacy” – iar jucătorii umani nu au fost nici unul mai înțelept

Republicat de Platon

Mai mult de la Singularity Hub

Oamenii de știință convinge bacteriile să producă proteine exotice care nu se găsesc în natură

Strămoșii noștri Homo Sapiens au împărtășit lumea cu neanderthalienii, denisovenii și alte tipuri de oameni al căror ADN trăiește în genele noastre

Noul lichid programabil de la Harvard își schimbă proprietățile la cerere

Acest algoritm proiectează proteinele de la zero pentru a accelera descoperirea medicamentelor

Ce este un GPU? Cipurile care alimentează boom-ul AI și de ce valorează trilioane

Praful cosmic de la Venus inspiră o nouă tehnologie de combatere a poluării aerului

La fel ca oamenii, această IA inovatoare face concepte din cuvintele pe care le învață

Oamenii de știință tocmai au arătat cum computerele cuantice ar putea fi bazate pe undele sonore

Acest robot bucătar va distribui în curând chipsuri perfect condimentate la Chipotle

A început goana aurului lunar? De ce contează prima aterizare privată pe Lună

Despre noi

Căutare verticală și Ai

Platformă

Rămâneți conectat

Cont