Googles Genie AI bastelt Spiele aus einzelnen Bildern

Googles Genie AI bastelt Spiele aus einzelnen Bildern

Google hat im Rahmen seiner laufenden Investitionen in künstliche Intelligenz Genie angekündigt, eine App zur Entwicklung mobiler Spiele. 

Das generative KI-Modell Genie, entwickelt von Googles KI-Startup DeepMind, wurde in einer Live-Demo demonstriert. Genie lernt Spielmechaniken aus Hunderttausenden Gameplay-Videos und kann mit minimalen Eingabeaufforderungen spielbare Spiele generieren.

Lesen Sie auch: Figure AI sammelt 675 Millionen US-Dollar für arbeitslösende humanoide Robotik

Enthüllung des Genies

Wie im offiziellen DeepMind von Google angegeben Blog-Post, Genie ist ein grundlegendes Weltmodell, das mithilfe von Online-Videos trainiert wird. „Eine endlose Vielfalt an spielbaren (durch Aktionen steuerbaren) Welten aus synthetischen Bildern, Fotografien und sogar Skizzen“ kann das Modell erzeugen.

Genie, die Abkürzung für Generative Interactive Environments, wurde in Zusammenarbeit zwischen Google und der University of British Columbia entwickelt. Mit nur einem Bild können auf der Grundlage von Benutzereingaben seitlich scrollende 2D-Plattformer wie Contra und Super Mario Brothers generiert werden.

Allerdings erklärte Google DeepMind bei der Ankündigung, dass es mit Genie ein „neues Paradigma“ für generative künstliche Intelligenz (KI) einführt. Darüber hinaus erkannte das Unternehmen das Aufkommen generativer KI-Modelle an, die in der Lage sind, neuartige und kreative Inhalte über Sprache, Bilder und sogar Videos zu generieren.

Laut Google handelt es sich bei einem erheblichen Teil der 200,000 Stunden unbeaufsichtigter öffentlicher Internet-Gaming-Videos, an denen Genie geschult wurde, um 2D-Plattformspiele und nicht um vollständige Virtual-Reality-Spiele.

Spezifikationen des Genies

Was die Abmessungen angeht, liegt Genie bei 11 Milliarden Parametern. Das Modell umfasst außerdem einen raumzeitlichen Video-Tokenizer, ein autoregressives Dynamikmodell und ein einfaches und skalierbares Latent-Action-Modell. Diese Spezifikationen ermöglichen es Genie, Frame für Frame in generierten Umgebungen zu agieren, auch ohne Labels oder andere domänenspezifische Anforderungen beim Training.

Darüber hinaus kann Genie angewiesen werden, vielfältige interaktive und steuerbare Umgebungen zu generieren, obwohl es nur auf Videodaten trainiert wurde. Genie kann spielbare Umgebungen mit nur einer Bildaufforderung erstellen, im Gegensatz zu zahlreichen generativen KI-Modellen, die kreative Inhalte mit Sprachbildern und sogar Videos produzieren können.

Allerdings sagte Google DeepMind-Entwickler Tim Rocktäschel auf X (ehemals Twitter), dass sie sich auf die Skalierung konzentrieren, anstatt induktive Vorurteile hinzuzufügen.

Er fügte hinzu, dass sie einen Datensatz von über 200 Stunden Videos von 2D-Plattformern verwenden und ein 11B-Weltmodell trainieren. Auf unbeaufsichtigte Weise lernt Genie verschiedene latente Aktionen, die die Charaktere konsequent steuern.

Googles Genie AI bastelt Spiele aus einzelnen Bildern
Fotokredit: Google

Die Fähigkeiten des Genies

Laut Google Forschern zufolge basiert Genie auf drei Modellen: einem dynamischen Modell, das vorhersagt, was im nächsten Bild passieren wird, einem Video-Tokenizer, der rohe Videobilder in diskrete Token umwandelt, und einem latenten Aktionsmodell, das die Aktionen zwischen Videobildern ableiten kann.

Die Fähigkeit des grundlegenden Modells von Genie, den Hauptcharakter eines Spiels zu identifizieren, ohne dass man sich mit Aktionen oder Textanmerkungen vertraut machen muss, ist eine seiner einzigartigen Eigenschaften. Dank der Modelle, die es steuern, kann der Benutzer den Charakter mühelos steuern AI-generiert Virtual-Reality-Umgebung.

Rocktäschel sagte auch, dass Genie andere Medien in Spiele verwandeln könnte. Im begleitenden Google DeepMind-Forschungspapier kann Genie gebeten werden, aus verschiedenen Eingaben verschiedene aktionssteuerbare virtuelle Welten zu erstellen.

Darüber hinaus sagte Rocktäschel, dass das Modell jedes Bild in eine spielbare 2D-Welt umwandeln könne. Ihm zufolge kann Genie von Menschen entworfene Kreationen wie Skizzen zum Leben erwecken, zum Beispiel wunderschöne Kunstwerke von Seneca und Caspian, zwei der jüngsten Schöpfer der Welt.

Zeitstempel:

Mehr von MetaNews