Googlen tekoäly katseli 30,000 XNUMX tuntia videopelejä

Julkaissut Platon

seuraajia: 0

Googlen tekoäly katseli 30,000 XNUMX tuntia videopelejä – nyt se tekee oman PlatoBlockchain-tietoälyn. Pystysuuntainen haku. Ai.

Tekoäly tuottaa edelleen runsaasti valoa ja lämpöä. Parhaat teksti- ja kuvamallit – joilla on nyt tilauksia ja ne on kudottu kuluttajatuotteisiin – kilpailevat tuumista. OpenAI, Google ja Anthropic ovat kaikki, enemmän tai vähemmän, niskasta ja kaulasta.

Ei siis ole yllätys, että tekoälytutkijat haluavat työntää generatiivisia malleja uudelle alueelle. Koska tekoäly vaatii valtavia määriä dataa, yksi tapa ennustaa, missä mennään seuraavaksi, on tarkastella, mitä dataa on laajalti saatavilla verkossa, mutta jota ei vielä ole käytetty.

Video, jota on runsaasti, on ilmeinen seuraava askel. Todellakin, viime kuussa OpenAI esikatseli uusi tekstistä videoksi tekoäly nimeltä Sora joka hämmästytti katsojia.

Mutta entä video...pelit?

Kysy ja vastaanota

Osoittautuu, että verkossa on melko vähän pelaajavideoita. Google DeepMind kertoo kouluttaneensa uuden tekoälyn, Genien, 30,000 XNUMX tuntia kuratoitua videomateriaalia, jossa pelaajat pelaavat yksinkertaisia tasohyppelypelejä – ajatellaan varhaisia Nintendon pelejä – ja nyt se voi luoda omia esimerkkejä.

Genie muuttaa yksinkertaisen kuvan, valokuvan tai luonnoksen interaktiiviseksi videopeliksi.

Saatuaan kehotteen, esimerkiksi piirustuksen hahmosta ja sen ympäristöstä, tekoäly voi sitten ottaa syötteen pelaajalta siirtääkseen hahmoa sen maailmassa. Blogiviestissä DeepMind näytti Genien luomuksia navigoimassa 2D-maisemissa, kävelemässä tai hyppäämässä alustojen välillä. Kuten käärme, joka syö häntäänsä, jotkut näistä maailmoista saatiin jopa tekoälyn luomista kuvista.

Toisin kuin perinteiset videopelit, Genie luo näitä interaktiivisia maailmoja kehys kuvalta. Kun kehote ja komento liikkua, se ennustaa todennäköisimmin seuraavat kehykset ja luo ne lennossa. Se jopa oppi sisällyttämään parallaksin tunteen, joka on yleinen piirre tasohyppelyissä, joissa etuala liikkuu nopeammin kuin tausta.

Erityisesti tekoälyn koulutus ei sisältänyt tarroja. Pikemminkin Genie oppi korreloimaan syöttökomentoja – kuten mene vasemmalle, oikealle tai hyppää – pelin sisäisiin liikkeisiin yksinkertaisesti tarkkailemalla esimerkkejä harjoittelussaan. Eli kun videon hahmo liikkui vasemmalle, komentoa liikkeeseen yhdistävää etikettiä ei ollut. Genie keksi sen osan itsestään. Tämä tarkoittaa, että tulevia versioita voitaisiin mahdollisesti kouluttaa yhtä paljon soveltuvaa videota varten kuin verkossa on.

Tekoäly on vaikuttava todiste konseptista, mutta se on vielä hyvin varhaisessa kehitysvaiheessa, eikä DeepMind aio vielä julkaista mallia.

Pelit itsessään ovat pikselöityjä maailmoja, jotka virtaavat vauhdilla yksi kuva sekunnissa. Vertailun vuoksi nykyaikaiset videopelit voivat lyödä 60 tai 120 kuvaa sekunnissa. Lisäksi, kuten kaikki generatiiviset algoritmit, Genie luo outoja tai epäjohdonmukaisia visuaalisia esineitä. Se on myös taipuvainen hallusinoimaan "epärealistisia tulevaisuuksia", tiimi kirjoitti tekoälyä kuvaavassa paperissaan.

On kuitenkin muutamia syitä uskoa, että Genie paranee tästä eteenpäin.

Maailman pysähdys

Koska tekoäly voi oppia nimeämättömistä online-videoista ja se on edelleen vaatimaton koko – vain 11 miljardia parametria –, mahdollisuuksia laajentaa on runsaasti. Suuremmat mallit, jotka on koulutettu lisäämään tietoa, paranevat dramaattisesti. Ja a:n kanssa kasvava teollisuus keskittyi päättelemiseen-prosessi, jossa koulutettu tekoäly suorittaa tehtäviä, kuten kuvien tai tekstin luomista - se todennäköisesti nopeutuu.

DeepMind sanoo, että Genie voisi auttaa ihmisiä, kuten ammattikehittäjiä, tekemään videopelejä. Mutta kuten OpenAI – jonka mielestä Sora on enemmän kuin videoita – tiimi ajattelee laajemmin. Lähestymistapa voisi mennä paljon pidemmälle kuin videopelit.

Yksi esimerkki: AI, joka voi ohjata robotteja. Ryhmä koulutti videolla erillisen mallin robottikäsistä, jotka suorittivat erilaisia tehtäviä. Malli oppi manipuloimaan robotteja ja käsittelemään erilaisia esineitä.

DeepMind sanoi myös, että Genien luomia videopeliympäristöjä voitaisiin käyttää tekoälyagenttien kouluttamiseen. Se ei ole uusi strategia. Vuoden 2021 lehdessä toinen DeepMind-tiimi esitteli videopelin nimeltä XLand jota asuttivat tekoälyagentit ja tekoälyn yliherra luoden tehtäviä ja pelejä haastaakseen heidät. Ajatus siitä, että tekoälyn seuraava iso askel vaatii algoritmeja, jotka voivat kouluttaa toisiaan tai tuottaa synteettistä koulutusdataa. veto.

Kaikki tämä on viimeisin versio OpenAI:n ja Googlen välisessä kireässä kilpailussa tekoälyn edistymisestä. Kun muut kentällä, kuin Anthropic, kehittävät GPT-4:n kaltaisia multimodaalimalleja, Google ja OpenAI näyttävät myös keskittyvän maailmaa simuloiviin algoritmeihin. Tällaiset algoritmit voivat olla parempia suunnittelussa ja vuorovaikutuksessa. Molemmat ovat tärkeitä taitoja tekoälyagenteille, joita molemmat organisaatiot näyttävät aikovan tuottaa.

"Genie voidaan saada kuvilla, joita se ei ole koskaan ennen nähnyt, kuten todellisen maailman valokuvia tai luonnoksia, joiden avulla ihmiset voivat olla vuorovaikutuksessa kuviteltujen virtuaalisten maailmojensa kanssa, mikä toimii pohjimmiltaan perusmaailman mallina", tutkijat kirjoittivat Genie blogikirjoitus. ”Keskitymme siihen videoita 2D-tasohyppelypeleistä ja robotiikasta mutta menetelmämme on yleinen ja sen pitäisi toimia kaikentyyppisissä verkkotunnuksissa, ja se on skaalattavissa yhä suurempiin Internet-tietosarjoihin."

Vastaavasti, kun OpenAI esikatseli Soraa viime kuussa, tutkijat ehdottivat, että se voisi olla jotain perustavampaa: maailman simulaattori. Toisin sanoen molemmat tiimit näyttävät näkevän verkkovideoiden valtavan välimuistin keinona kouluttaa tekoäly luomaan oma video, mutta myös tehokkaammin ymmärtämään ja toimimaan maailmassa, verkossa tai sen ulkopuolella.

Onko tämä kannattavaa vai onko se pitkällä aikavälillä kestävää, on avoin kysymys. Ihmisen aivot toimivat hehkulampun arvolla; generatiivinen tekoäly käyttää kokonaisia datakeskuksia. Mutta on parasta olla aliarvioimatta tällä hetkellä pelissä olevia voimia – lahjakkuuden, tekniikan, aivojen ja käteisvarojen osalta – tavoitteena ei vain parantaa tekoälyä vaan myös tehostaa sitä.

Olemme nähneet vaikuttavaa edistystä tekstissä, kuvissa, äänessä ja kaikissa kolmessa yhdessä. Videot ovat seuraava ainesosa, joka heitetään kattilaan, ja niistä voi saada vieläkin tehokkaamman juoman.

Kuva pistetilanne: Google DeepMind