Googles Genie AI Crafts-spill fra enkeltbilder

Publisert av Platon

Følgere: 0

Google har annonsert Genie, en app for å lage mobilspill, som en del av sin pågående investering i kunstig intelligens.

Den generative AI-modellen Genie, utviklet av Googles AI-oppstart DeepMind, demonstrerte en live-demo. Genie lærer spillmekanikk fra hundretusenvis av spillvideoer og kan generere spillbare spill med minimale spørsmål.

Google DeepMind avslører AI 'Genie' for å umiddelbart fremkalle spillbare spill https://t.co/9c6iMsZ1Qa $ GOOG $ GOOGL

— BizTechia (@BizTechia) Februar 27, 2024

Les også: Figur AI for å samle inn 675 millioner dollar for Labour-Solving Humanoid Robotics

Avduking av Genie

Som det står i Googles offisielle DeepMind blogginnlegg, Genie er en grunnleggende verdensmodell som er trent ved hjelp av nettvideoer. "Et uendelig utvalg av spillbare (handlingskontrollerbare) verdener fra syntetiske bilder, fotografier og til og med skisser" kan produseres av modellen.

Genie, forkortelse for Generative Interactive Environments, ble utviklet i samarbeid mellom Google og University of British Columbia. Med bare ett bilde kan den generere siderullende 2D-plattformspillere som Contra og Super Mario Brothers basert på brukeroppfordringer.

Google DeepMind uttalte imidlertid under kunngjøringen at de introduserer et "nytt paradigme" for generativ kunstig intelligens (AI) i form av Genie. I tillegg anerkjente selskapet fremveksten av generative AI-modeller som er i stand til å generere nytt og kreativt innhold via språk, bilder og til og med videoer.

Google presenterer Genie

Generative interaktive miljøer

introduser Genie, det første generative interaktive miljøet trent på en uovervåket måte fra umerkede Internett-videoer. Modellen kan bli bedt om å generere et uendelig utvalg av handlingskontrollerbare virtuelle... pic.twitter.com/ZO1focG7Vx

—AK (@_akhaliq) Februar 26, 2024

Ifølge Google er en betydelig del av de 200,000 2 timene med uovervåkede offentlige internettspillvideoer som Genie ble trent på, XNUMXD-plattformspillere i stedet for full virtuell virkelighet-spill.

Genies spesifikasjoner

Når det kommer til dimensjoner, står Genie på 11 milliarder parametere. En spatiotemporal videotokenizer, en autoregressiv dynamikkmodell og en enkel og skalerbar latent handlingsmodell er også inkludert i modellen. Disse spesifikasjonene gjør at Genie kan opptre i genererte miljøer bilde-for-bilde, selv uten etiketter eller andre domenespesifikke krav når de trener.

I tillegg kan Genie bli instruert til å generere et mangfoldig sett med interaktive og kontrollerbare miljøer, til tross for at den er trent på kun videodata. Genie kan lage spillbare miljøer med bare én bildemelding, i motsetning til mange generative AI-modeller som kan produsere kreativt innhold med språkbilder og til og med videoer.

Imidlertid sa Google DeepMind-utvikler Tim Rocktäschel på X (tidligere Twitter) at de fokuserer på skala i stedet for å legge til induktive skjevheter.

I stedet for å legge til induktive skjevheter, fokuserer vi på skala. Vi bruker et datasett på >200 2 timer med videoer fra 11D-plattformer og trener en XNUMXB verdensmodell. På en uovervåket måte lærer Genie forskjellige latente handlinger som kontrollerer karakterer på en konsekvent måte. pic.twitter.com/71a3iuAGZA

— Tim Rocktäschel (@_rockt) Februar 26, 2024

Han la til at de bruker et datasett med over 200 2 timer med videoer fra 11D-plattformer og trener en XNUMXB verdensmodell. På en uovervåket måte lærer Genie forskjellige latente handlinger som konsekvent kontrollerer karakterer.

Googles Genie AI Crafts-spill fra enkeltbilder — Fotokreditt: Google

Genies evner

Ifølge Google forskere, Genie er drevet av tre modeller: en dynamisk modell som forutsier hva som vil skje i neste bilde, en videotokenizer som gjør rå videorammer til diskrete tokens, og en latent handlingsmodell som kan utlede handlingene mellom videobilder.

Genies grunnleggende modells evne til å identifisere et spills primærkarakter uten å bli trent på handling eller tekstkommentarer er en av dens unike funksjoner. Takket være modellene som driver den, kan brukeren enkelt kontrollere karakteren i en AI-generert virtuell virkelighet miljø.

Rocktäschel sa også at Genie kunne gjøre andre medier til spill. Genie kan bli bedt om å lage ulike handlingskontrollerbare virtuelle verdener fra ulike input i den medfølgende Google DeepMind-forskningsartikkelen.

Jeg er veldig spent på å avsløre hva @GoogleDeepMindsitt Open Endedness Team har vært opp til 🚀. Vi introduserer Genie 🧞, en grunnleggende verdensmodell trent utelukkende fra Internett-videoer som kan generere en endeløs rekke handlingskontrollerbare 2D-verdener gitt bildemeldinger. pic.twitter.com/TnQ8uv81wc

— Tim Rocktäschel (@_rockt) Februar 26, 2024

Videre sa Rocktäschel at modellen kan konvertere ethvert bilde til en spillbar 2D-verden. Ifølge ham kan Genie levendegjøre menneskedesignede kreasjoner som skisser, for eksempel vakre kunstverk fra Seneca og Caspian, to av de yngste verdensskaperne noensinne.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
kilde: https://metanews.com/googles-genie-ai-crafts-games-from-single-images/

Tidstempel: Februar 29, 2024

Tidstempel: April 12, 2024

Googles Genie AI Crafts-spill fra enkeltbilder

Publisert av Platon

Avduking av Genie

Genies spesifikasjoner

Genies evner

Mer fra MetaNews

AI-skrevne e-bøker boomer på Amazon etter lansering av ChatGPT

Lady Gaga Headlines Music Festival i Fortnite Metaverse

Krypto-prisdiagrammer lagt til Twitter

God of War: Ragnarok, kommer sent i 2022 til PC og PS5

USA finansierer ukrainsk eSport-program for å bekjempe feilinformasjon

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn