Googlen Genie AI Crafts Games yksittäisistä kuvista

Googlen Genie AI Crafts Games yksittäisistä kuvista

Google on julkistanut Genien, mobiilipelien tekemiseen tarkoitetun sovelluksen, osana jatkuvaa investointiaan tekoälyyn. 

Googlen tekoälystartupin DeepMindin kehittämä generatiivinen tekoälymalli Genie esitti live-demon. Genie oppii pelimekaniikkaa sadoista tuhansista pelivideoista ja voi luoda pelattavia pelejä minimaalisilla kehotteilla.

Lue myös: Kuvaa AI kerätä 675 miljoonaa dollaria Labour-Solving Humanoid Robotics

Genien paljastaminen

Kuten Googlen virallisessa DeepMindissä todetaan blogi, Genie on perusmaailman malli, joka on koulutettu verkkovideoiden avulla. ”Mallilla voidaan tuottaa loputon valikoima pelattavia (toimintaohjattavia) maailmoja synteettisistä kuvista, valokuvista ja jopa luonnoksista.

Genie, lyhenne sanoista Generative Interactive Environments, kehitettiin yhteistyössä Googlen ja British Columbian yliopiston kanssa. Yhdellä kuvalla se voi luoda sivuttain vieriviä 2D-tasohyppelyjä, kuten Contra ja Super Mario Brothers, käyttäjän kehotteiden perusteella.

Google DeepMind ilmoitti kuitenkin ilmoituksen aikana, että se esittelee "uuden paradigman" generatiiviselle tekoälylle (AI) Genien muodossa. Lisäksi yhtiö tunnusti generatiivisten tekoälymallien syntymisen, jotka pystyvät luomaan uutta ja luovaa sisältöä kielen, kuvien ja jopa videoiden avulla.

Googlen mukaan merkittävä osa 200,000 2 tunnin valvomattomista julkisista Internet-pelivideoista, joihin Genie oli koulutettu, on XNUMXD-tasohyppelyitä eikä täysiä virtuaalitodellisuuspelejä.

Genien tekniset tiedot

Mittojen suhteen Genien parametrit ovat 11 miljardia. Malliin sisältyy myös spatiotemporaalinen videotokenisaattori, autoregressiivinen dynamiikkamalli sekä yksinkertainen ja skaalautuva latenttitoimintamalli. Nämä tekniset tiedot antavat Genien toimia luoduissa ympäristöissä kehys kehykseltä, jopa ilman tunnisteita tai muita toimialuekohtaisia ​​vaatimuksia harjoittelun aikana.

Lisäksi Genie voidaan ohjeistaa luomaan erilaisia ​​vuorovaikutteisia ja ohjattavia ympäristöjä, vaikka se on koulutettu vain videodataan. Genie voi luoda pelattavia ympäristöjä yhdellä kuvakehotteella, toisin kuin monet generatiiviset tekoälymallit, jotka voivat tuottaa luovaa sisältöä kielikuvilla ja jopa videoilla.

Google DeepMind -kehittäjä Tim Rocktäschel sanoi kuitenkin X:ssä (entinen Twitter), että he keskittyvät mittakaavaan induktiivisten harhojen lisäämisen sijaan.

Hän lisäsi, että he käyttävät yli 200 2 tunnin videoiden datajoukkoa 11D-tasohyppelyiltä ja kouluttavat XNUMXB-maailmanmallia. Valvomattomalla tavalla Genie oppii erilaisia ​​piileviä toimintoja, jotka ohjaavat jatkuvasti hahmoja.

Googlen Genie AI Crafts Games yksittäisistä kuvista
Valokuvahaku: Google

Genien kyvyt

Mukaan Google tutkijoiden, Genien ohjaamana on kolme mallia: dynaaminen malli, joka ennustaa, mitä seuraavassa ruudussa tapahtuu, videotokenisaattori, joka muuttaa raakavideokehykset erillisiksi tunnisteiksi, ja piilevä toimintamalli, joka voi päätellä videokehysten väliset toimet.

Genien perusmallin kyky tunnistaa pelin ensisijainen hahmo ilman koulutusta toimintaan tai tekstimerkintöihin on yksi sen ainutlaatuisista ominaisuuksista. Sitä ohjaavien mallien ansiosta käyttäjä voi ohjata hahmoa vaivattomasti Tekoälyn tuottama virtuaalitodellisuusympäristö.

Rocktäschel sanoi myös, että Genie voisi muuttaa muun median peleiksi. Genietä voidaan pyytää luomaan erilaisia ​​toiminnallisesti ohjattavia virtuaalimaailmoja eri syötteistä oheisessa Google DeepMind -tutkimuspaperissa.

Lisäksi Rocktäschel sanoi, että malli voi muuntaa minkä tahansa kuvan pelattavaksi 2D-maailmaksi. Hänen mukaansa Genie voi herättää henkiin ihmisten suunnittelemia luomuksia, kuten luonnoksia, esimerkiksi kauniita taideteoksia Senecalta ja Caspianilta, kahdelta maailman nuorimmasta luojasta.

Aikaleima:

Lisää aiheesta MetaNews