Google'i Genie AI käsitöömängud üksikpiltidest

Google'i Genie AI käsitöömängud üksikpiltidest

Google on teatanud mobiilimängude tegemise rakendusest Genie, mis on osa oma jätkuvast investeeringust tehisintellekti. 

Google'i AI idufirma DeepMind välja töötatud generatiivne AI mudel Genie demonstreeris reaalajas demo. Genie õpib mängumehaanikat sadade tuhandete mänguvideote põhjal ja suudab luua mängitavaid mänge minimaalsete viipadega.

Samuti loe: Joonis AI, et koguda 675 miljonit dollarit tööjõudu lahendava humanoidrobootika jaoks

Genie paljastamine

Nagu on öeldud Google'i ametlikus DeepMindis blogi postitus, Genie on põhiline maailmamudel, mis on koolitatud veebivideote abil. Mudel suudab luua lõputult erinevaid mängitavaid (tegevusega juhitavaid) maailmu sünteetilistest piltidest, fotodest ja isegi visanditest.

Genie, lühend sõnast Generative Interactive Environments, töötati välja Google'i ja Briti Columbia ülikooli koostöös. Ainult ühe pildiga saab see kasutajate juhiste põhjal genereerida külgkerivaid 2D-platvorme, nagu Contra ja Super Mario Brothers.

Google DeepMind teatas aga teadaande ajal, et tutvustab Genie näol generatiivse tehisintellekti (AI) "uut paradigmat". Lisaks tunnistas ettevõte generatiivsete AI mudelite tekkimist, mis suudavad luua uudset ja loomingulist sisu keele, piltide ja isegi videote kaudu.

Google'i andmetel on märkimisväärne osa 200,000 2 tunnist järelevalveta avalikest Interneti-mänguvideotest, mida Genie koolitati, pigem XNUMXD-platvormimängijad kui täielikud virtuaalreaalsuse mängud.

Genie spetsifikatsioonid

Kui rääkida mõõtmetest, siis Genie parameetrite arv on 11 miljardit. Mudelisse on kaasatud ka spatiotemporaalne video tokenisaator, autoregressiivne dünaamika mudel ning lihtne ja skaleeritav latentse tegevuse mudel. Need spetsifikatsioonid võimaldavad Genie'l tegutseda loodud keskkondades kaaderhaaval, isegi ilma siltide või muude domeenispetsiifiliste nõueteta treenimisel.

Lisaks saab Genie'le anda korralduse luua mitmekesine interaktiivsete ja juhitavate keskkondade komplekt, hoolimata sellest, et teda on õpetatud ainult videoandmetega. Genie suudab luua mängitavaid keskkondi vaid ühe pildiviipaga, erinevalt paljudest generatiivsetest AI mudelitest, mis suudavad luua loomingulist sisu koos keelekujutiste ja isegi videotega.

Google DeepMindi arendaja Tim Rocktäschel ütles aga X-is (endine Twitter), et nad keskenduvad pigem mastaabile kui induktiivsete eelarvamuste lisamisele.

Ta lisas, et nad kasutavad andmestikku, mis koosneb enam kui 200 2 tunni pikkusest 11D-platvormiseadmete videotest ja koolitavad XNUMXB maailmamudelit. Järelevalveta õpib Genie erinevaid varjatud toiminguid, mis järjekindlalt tegelasi kontrollivad.

Google'i Genie AI käsitöömängud üksikpiltidest
Fotokrediit: Google

Genie võimalused

Järgi Google Teadlaste sõnul juhivad Genie't kolm mudelit: dünaamiline mudel, mis ennustab, mis juhtub järgmises kaadris, videomärgis, mis muudab töötlemata videokaadrid diskreetseteks märkideks, ja varjatud tegevusmudel, mis võib järeldada tegevusi videokaadrite vahel.

Genie põhimudeli võime tuvastada mängu peamist tegelast ilma tegevust või tekstimärkusi õpetamata on üks selle ainulaadseid omadusi. Tänu seda juhtivatele mudelitele saab kasutaja tegelast vaevata juhtida Tehisintellekti abil loodud virtuaalreaalsuse keskkond.

Rocktäschel ütles ka, et Genie võib muu meedia mängudeks muuta. Juuresolevas Google DeepMindi uurimistöös võib Genie'l paluda luua erinevatest sisenditest erinevaid tegevusega juhitavaid virtuaalmaailmu.

Lisaks ütles Rocktäschel, et mudel suudab mis tahes pildi teisendada mängitavaks 2D-maailmaks. Tema sõnul suudab Genie ellu äratada inimeste loodud loomingut, nagu visandid, näiteks kaunid kunstiteosed Senecalt ja Caspianilt, kahelt maailma noorimalt loojalt.

Ajatempel:

Veel alates MetaNews