Genie AI di Google crea giochi da singole immagini

Genie AI di Google crea giochi da singole immagini

Google ha annunciato Genie, un'app per creare giochi mobili, come parte del suo continuo investimento nell'intelligenza artificiale. 

Il modello di intelligenza artificiale generativa Genie, sviluppato dalla startup AI di Google DeepMind, ha dimostrato una demo dal vivo. Genie apprende le meccaniche di gioco da centinaia di migliaia di video di gameplay e può generare giochi giocabili con istruzioni minime.

Leggi anche: Figure AI raccoglierà 675 milioni di dollari per la robotica umanoide che risolve il lavoro

Genio svelato

Come affermato nel DeepMind ufficiale di Google post sul blog, Genie è un modello mondiale fondamentale formato utilizzando video online. Il modello può produrre "un'infinita varietà di mondi giocabili (controllabili dall'azione) da immagini sintetiche, fotografie e persino schizzi".

Genie, abbreviazione di Generative Interactive Environments, è stato sviluppato in collaborazione tra Google e l'Università della British Columbia. Con una sola immagine, può generare platform 2D a scorrimento laterale come Contra e Super Mario Brothers in base alle istruzioni dell'utente.

Tuttavia, Google DeepMind ha dichiarato durante l'annuncio che sta introducendo un "nuovo paradigma" per l'intelligenza artificiale generativa (AI) sotto forma di Genie. Inoltre, l’azienda ha riconosciuto l’emergere di modelli di intelligenza artificiale generativa in grado di generare contenuti nuovi e creativi tramite linguaggio, immagini e persino video.

Secondo Google, una parte significativa delle 200,000 ore di video di giochi pubblici su Internet senza supervisione su cui Genie è stato addestrato sono platform 2D piuttosto che giochi di realtà virtuale completi.

Specifiche del Genio

Quando si tratta di dimensioni, Genie raggiunge 11 miliardi di parametri. Nel modello sono inclusi anche un tokenizzatore video spaziotemporale, un modello di dinamica autoregressiva e un modello di azione latente semplice e scalabile. Queste specifiche consentono a Genie di agire negli ambienti generati fotogramma per fotogramma, anche senza etichette o altri requisiti specifici del dominio durante l'addestramento.

Inoltre, Genie può essere incaricato di generare una serie diversificata di ambienti interattivi e controllabili, nonostante sia addestrato su dati solo video. Genie può creare ambienti riproducibili con un solo prompt di immagine, a differenza di numerosi modelli di intelligenza artificiale generativa che possono produrre contenuti creativi con immagini linguistiche e persino video.

Tuttavia, lo sviluppatore di Google DeepMind Tim Rocktäschel ha dichiarato su X (ex Twitter) che si concentrano sulla scala piuttosto che sull'aggiunta di pregiudizi induttivi.

Ha aggiunto che utilizzano un set di dati di oltre 200 ore di video da piattaforme 2D e addestrano un modello mondiale 11B. Senza supervisione, Genio apprende diverse azioni latenti che controllano costantemente i personaggi.

Genie AI di Google crea giochi da singole immagini
Credito fotografico: Google

Le capacità del genio

Secondo Google ricercatori, Genie è guidato da tre modelli: un modello dinamico che prevede cosa accadrà nel fotogramma successivo, un tokenizzatore video che trasforma i fotogrammi video grezzi in token discreti e un modello di azione latente che può dedurre le azioni tra i fotogrammi video.

La capacità del modello fondamentale di Genie di identificare il personaggio principale di un gioco senza essere addestrato su azioni o annotazioni di testo è una delle sue caratteristiche uniche. Grazie ai modelli che lo guidano, l'utente può controllare senza sforzo il personaggio in un Generato dall'IA ambiente di realtà virtuale.

Rocktäschel ha anche affermato che Genie potrebbe trasformare altri media in giochi. A Genie può essere chiesto di creare vari mondi virtuali controllabili dall'azione da vari input nel documento di ricerca di Google DeepMind allegato.

Inoltre, Rocktäschel ha affermato che il modello può convertire qualsiasi immagine in un mondo 2D giocabile. Secondo lui, Genie può dare vita a creazioni progettate dall'uomo come schizzi, ad esempio, bellissime opere d'arte di Seneca e Caspian, due dei più giovani creatori del mondo.

Timestamp:

Di più da MetaNotizie