Googlov Genie AI Crafts Games iz posameznih slik

Googlov Genie AI Crafts Games iz posameznih slik

Google je napovedal Genie, aplikacijo za izdelavo mobilnih iger, kot del svojih stalnih naložb v umetno inteligenco. 

Generativni AI model Genie, ki ga je razvil Googlov AI startup DeepMind, je pokazal predstavitev v živo. Genie se uči mehanike iger iz več sto tisoč videoposnetkov igranja iger in lahko ustvari igre, ki jih je mogoče igrati z minimalnimi pozivi.

Preberite tudi: Slika AI bo zbrala 675 milijonov dolarjev za humanoidno robotiko, ki rešuje delo

Razkritje Genie

Kot je navedeno v Googlovem uradnem DeepMind blog post, Genie je temeljni svetovni model, usposobljen s pomočjo spletnih videoposnetkov. »Neskončno različnih svetov, ki jih je mogoče igrati (ki jih je mogoče nadzorovati z akcijo) iz sintetičnih slik, fotografij in celo skic«, lahko ustvari model.

Genie, okrajšava za Generative Interactive Environments, je bil razvit v sodelovanju med Googlom in Univerzo Britanske Kolumbije. S samo eno sliko lahko na podlagi uporabniških pozivov ustvari 2D platformske igre s stranskim drsenjem, kot sta Contra in Super Mario Brothers.

Vendar je Google DeepMind med objavo izjavil, da uvaja "novo paradigmo" za generativno umetno inteligenco (AI) v obliki Genie. Poleg tega je podjetje priznalo nastanek generativnih modelov umetne inteligence, ki lahko ustvarijo nove in ustvarjalne vsebine prek jezika, slik in celo videoposnetkov.

Po mnenju Googla je precejšen del od 200,000 ur nenadzorovanih videoposnetkov javnih internetnih iger, na katerih se je Genie usposabljal, 2D platforme in ne popolne igre virtualne resničnosti.

Geniejeve specifikacije

Ko gre za dimenzije, ima Genie 11 milijard parametrov. V model so vključeni tudi prostorsko-časovni video tokenizer, avtoregresivni dinamični model ter preprost in razširljiv model latentnega delovanja. Te specifikacije omogočajo Genie, da deluje v ustvarjenih okoljih okvir za okvirjem, tudi brez oznak ali drugih domensko specifičnih zahtev med usposabljanjem.

Poleg tega lahko Genie dobi navodila za ustvarjanje raznolikega nabora interaktivnih in nadzorovanih okolij, kljub temu, da je usposobljen samo za video podatke. Genie lahko ustvari igralna okolja s samo enim slikovnim pozivom, v nasprotju s številnimi generativnimi modeli AI, ki lahko ustvarijo ustvarjalno vsebino z jezikovnimi slikami in celo videoposnetki.

Vendar pa je razvijalec Google DeepMind Tim Rocktäschel na X (prej Twitterju) dejal, da se osredotočajo na obseg in ne na dodajanje induktivnih pristranskosti.

Dodal je, da uporabljajo nabor podatkov z več kot 200 urami videoposnetkov iz platforme 2D in usposabljajo model sveta 11B. Na nenadzorovan način se Genie nauči različnih latentnih dejanj, ki dosledno nadzorujejo like.

Googlov Genie AI Crafts Games iz posameznih slik
Foto: Google

Geniejeve zmožnosti

Glede na google raziskovalcev Genie poganjajo trije modeli: dinamični model, ki napove, kaj se bo zgodilo v naslednjem okvirju, video tokenizer, ki neobdelane video okvirje spremeni v diskretne žetone, in latentni akcijski model, ki lahko sklepa o dejanjih med video okvirji.

Sposobnost Geniejevega temeljnega modela, da identificira primarni značaj igre, ne da bi bil usposobljen za opombe o dejanjih ali besedilu, je ena od njegovih edinstvenih lastnosti. Zahvaljujoč modelom, ki ga poganjajo, lahko uporabnik brez truda nadzoruje lik v Ustvarjeno z umetno inteligenco okolje virtualne resničnosti.

Rocktäschel je tudi dejal, da lahko Genie druge medije spremeni v igre. Od Genie lahko zahtevate, da ustvari različne virtualne svetove, ki jih je mogoče nadzorovati z dejanji, iz različnih vnosov v spremnem raziskovalnem dokumentu Google DeepMind.

Poleg tega je Rocktäschel dejal, da lahko model pretvori katero koli sliko v 2D svet, ki ga je mogoče igrati. Po njegovih besedah ​​lahko Genie oživi stvaritve, ki jih je oblikoval človek, kot so na primer skice, čudovita umetniška dela Seneke in Kaspijana, dveh najmlajših svetovnih ustvarjalcev.

Časovni žig:

Več od MetaNovice