Googles Genie AI Crafts-spill fra enkeltbilder

Googles Genie AI Crafts-spill fra enkeltbilder

Google har annonsert Genie, en app for å lage mobilspill, som en del av sin pågående investering i kunstig intelligens. 

Den generative AI-modellen Genie, utviklet av Googles AI-oppstart DeepMind, demonstrerte en live-demo. Genie lærer spillmekanikk fra hundretusenvis av spillvideoer og kan generere spillbare spill med minimale spørsmål.

Les også: Figur AI for å samle inn 675 millioner dollar for Labour-Solving Humanoid Robotics

Avduking av Genie

Som det står i Googles offisielle DeepMind blogginnlegg, Genie er en grunnleggende verdensmodell som er trent ved hjelp av nettvideoer. "Et uendelig utvalg av spillbare (handlingskontrollerbare) verdener fra syntetiske bilder, fotografier og til og med skisser" kan produseres av modellen.

Genie, forkortelse for Generative Interactive Environments, ble utviklet i samarbeid mellom Google og University of British Columbia. Med bare ett bilde kan den generere siderullende 2D-plattformspillere som Contra og Super Mario Brothers basert på brukeroppfordringer.

Google DeepMind uttalte imidlertid under kunngjøringen at de introduserer et "nytt paradigme" for generativ kunstig intelligens (AI) i form av Genie. I tillegg anerkjente selskapet fremveksten av generative AI-modeller som er i stand til å generere nytt og kreativt innhold via språk, bilder og til og med videoer.

Ifølge Google er en betydelig del av de 200,000 2 timene med uovervåkede offentlige internettspillvideoer som Genie ble trent på, XNUMXD-plattformspillere i stedet for full virtuell virkelighet-spill.

Genies spesifikasjoner

Når det kommer til dimensjoner, står Genie på 11 milliarder parametere. En spatiotemporal videotokenizer, en autoregressiv dynamikkmodell og en enkel og skalerbar latent handlingsmodell er også inkludert i modellen. Disse spesifikasjonene gjør at Genie kan opptre i genererte miljøer bilde-for-bilde, selv uten etiketter eller andre domenespesifikke krav når de trener.

I tillegg kan Genie bli instruert til å generere et mangfoldig sett med interaktive og kontrollerbare miljøer, til tross for at den er trent på kun videodata. Genie kan lage spillbare miljøer med bare én bildemelding, i motsetning til mange generative AI-modeller som kan produsere kreativt innhold med språkbilder og til og med videoer.

Imidlertid sa Google DeepMind-utvikler Tim Rocktäschel på X (tidligere Twitter) at de fokuserer på skala i stedet for å legge til induktive skjevheter.

Han la til at de bruker et datasett med over 200 2 timer med videoer fra 11D-plattformer og trener en XNUMXB verdensmodell. På en uovervåket måte lærer Genie forskjellige latente handlinger som konsekvent kontrollerer karakterer.

Googles Genie AI Crafts-spill fra enkeltbilder
Fotokreditt: Google

Genies evner

Ifølge Google forskere, Genie er drevet av tre modeller: en dynamisk modell som forutsier hva som vil skje i neste bilde, en videotokenizer som gjør rå videorammer til diskrete tokens, og en latent handlingsmodell som kan utlede handlingene mellom videobilder.

Genies grunnleggende modells evne til å identifisere et spills primærkarakter uten å bli trent på handling eller tekstkommentarer er en av dens unike funksjoner. Takket være modellene som driver den, kan brukeren enkelt kontrollere karakteren i en AI-generert virtuell virkelighet miljø.

Rocktäschel sa også at Genie kunne gjøre andre medier til spill. Genie kan bli bedt om å lage ulike handlingskontrollerbare virtuelle verdener fra ulike input i den medfølgende Google DeepMind-forskningsartikkelen.

Videre sa Rocktäschel at modellen kan konvertere ethvert bilde til en spillbar 2D-verden. Ifølge ham kan Genie levendegjøre menneskedesignede kreasjoner som skisser, for eksempel vakre kunstverk fra Seneca og Caspian, to av de yngste verdensskaperne noensinne.

Tidstempel:

Mer fra MetaNews