Jeux d'artisanat Genie AI de Google à partir d'images uniques

Jeux d'artisanat Genie AI de Google à partir d'images uniques

Google a annoncé Genie, une application permettant de créer des jeux mobiles, dans le cadre de son investissement continu dans l'intelligence artificielle. 

Le modèle d'IA générative Genie, développé par la startup d'IA de Google DeepMind, a fait une démonstration en direct. Genie apprend les mécanismes de jeu à partir de centaines de milliers de vidéos de jeu et peut générer des jeux jouables avec un minimum d'invites.

Lisez aussi: Figure AI va lever 675 millions de dollars pour la robotique humanoïde qui résout le travail

Dévoilement du Génie

Comme indiqué dans le DeepMind officiel de Google blog récents, Genie est un modèle mondial fondamental formé à l'aide de vidéos en ligne. « Une variété infinie de mondes jouables (contrôlables par l'action) à partir d'images synthétiques, de photographies et même de croquis » peut être produite par le modèle.

Genie, abréviation de Generative Interactive Environments, a été développé en partenariat entre Google et l'Université de la Colombie-Britannique. Avec une seule image, il peut générer des jeux de plateforme 2D à défilement latéral tels que Contra et Super Mario Brothers en fonction des invites de l'utilisateur.

Cependant, Google DeepMind a déclaré lors de l'annonce qu'il introduisait un « nouveau paradigme » pour l'intelligence artificielle (IA) générative sous la forme de Genie. De plus, la société a reconnu l’émergence de modèles d’IA génératifs capables de générer du contenu nouveau et créatif via le langage, les images et même les vidéos.

Selon Google, une partie importante des 200,000 2 heures de vidéos de jeux publiques non supervisées sur Internet sur lesquelles Genie a été formé sont des jeux de plateforme XNUMXD plutôt que des jeux de réalité virtuelle complets.

Spécifications du Génie

En ce qui concerne les dimensions, Genie compte 11 milliards de paramètres. Un tokeniseur vidéo spatio-temporel, un modèle de dynamique autorégressive et un modèle d'action latente simple et évolutif sont également inclus dans le modèle. Ces spécifications permettent à Genie d'agir dans les environnements générés image par image, même sans étiquettes ou autres exigences spécifiques au domaine lors de la formation.

De plus, Genie peut être chargé de générer un ensemble diversifié d'environnements interactifs et contrôlables, bien qu'il soit formé sur des données uniquement vidéo. Genie peut créer des environnements jouables avec une seule invite d'image, contrairement à de nombreux modèles d'IA générative qui peuvent produire du contenu créatif avec des images linguistiques et même des vidéos.

Cependant, Tim Rocktäschel, développeur de Google DeepMind, a déclaré sur X (anciennement Twitter) qu'ils se concentraient sur l'échelle plutôt que sur l'ajout de biais inductifs.

Il a ajouté qu'ils utilisent un ensemble de données de plus de 200 2 heures de vidéos provenant de jeux de plateforme 11D et entraînent un modèle mondial XNUMXB. De manière non supervisée, Génie apprend diverses actions latentes qui contrôlent systématiquement les personnages.

Jeux d'artisanat Genie AI de Google à partir d'images uniques
Crédit photo: Google

Les capacités du génie

Selon Google chercheurs, Genie est piloté par trois modèles : un modèle dynamique qui prédit ce qui se passera dans l'image suivante, un tokeniseur vidéo qui transforme les images vidéo brutes en jetons discrets et un modèle d'action latente qui peut déduire les actions entre les images vidéo.

La capacité du modèle fondamental de Genie à identifier le personnage principal d'un jeu sans être formé aux actions ou aux annotations de texte est l'une de ses caractéristiques uniques. Grâce aux modèles qui le pilotent, l'utilisateur peut contrôler le personnage sans effort de manière Généré par l'IA environnement de réalité virtuelle.

Rocktäschel a également déclaré que Genie pourrait transformer d'autres médias en jeux. Genie peut être invité à créer divers mondes virtuels contrôlables par l'action à partir de diverses entrées dans le document de recherche Google DeepMind qui l'accompagne.

De plus, Rocktäschel a déclaré que le modèle peut convertir n'importe quelle image en un monde 2D jouable. Selon lui, le Génie peut donner vie à des créations conçues par l'homme, telles que des croquis, par exemple de magnifiques œuvres d'art de Sénèque et Caspian, deux des plus jeunes créateurs mondiaux de tous les temps.

Horodatage:

Plus de MétaActualités