Juegos de manualidades Genie AI de Google a partir de imágenes individuales

Juegos de manualidades Genie AI de Google a partir de imágenes individuales

Google ha anunciado Genie, una aplicación para crear juegos móviles, como parte de su inversión continua en inteligencia artificial. 

El modelo de IA generativa Genie, desarrollado por la startup de IA de Google, DeepMind, realizó una demostración en vivo. Genie aprende la mecánica del juego a partir de cientos de miles de vídeos de juego y puede generar juegos jugables con indicaciones mínimas.

Lea también Figure AI recaudará 675 millones de dólares para robótica humanoide que resuelve el trabajo

Genio revelador

Como se indica en el DeepMind oficial de Google del blogGenie es un modelo mundial fundamental formado mediante vídeos en línea. El modelo puede producir “una variedad infinita de mundos jugables (controlables por acción) a partir de imágenes sintéticas, fotografías e incluso bocetos”.

Genie, abreviatura de Generative Interactive Environments, fue desarrollado en colaboración entre Google y la Universidad de Columbia Británica. Con solo una imagen, puede generar plataformas 2D de desplazamiento lateral como Contra y Super Mario Brothers según las indicaciones del usuario.

Sin embargo, Google DeepMind declaró durante el anuncio que está introduciendo un "nuevo paradigma" para la inteligencia artificial generativa (IA) en forma de Genie. Además, la empresa reconoció la aparición de modelos de IA generativa capaces de generar contenido novedoso y creativo a través del lenguaje, imágenes e incluso vídeos.

Según Google, una parte importante de las 200,000 horas de vídeos de juegos públicos en Internet sin supervisión en los que se entrenó a Genie son plataformas 2D en lugar de juegos de realidad virtual.

Especificaciones del genio

En cuanto a dimensiones, Genie cuenta con 11 mil millones de parámetros. También se incluyen en el modelo un tokenizador de vídeo espaciotemporal, un modelo de dinámica autorregresiva y un modelo de acción latente simple y escalable. Estas especificaciones permiten a Genie actuar en entornos generados cuadro por cuadro, incluso sin etiquetas u otros requisitos específicos del dominio durante el entrenamiento.

Además, se puede instruir a Genie para que genere un conjunto diverso de entornos interactivos y controlables, a pesar de haber sido entrenado solo con datos de video. Genie puede crear entornos reproducibles con solo una imagen, a diferencia de numerosos modelos de IA generativa que pueden producir contenido creativo con imágenes en lenguaje e incluso videos.

Sin embargo, el desarrollador de Google DeepMind, Tim Rocktäschel, dijo en X (anteriormente Twitter) que se centran en la escala en lugar de añadir sesgos inductivos.

Añadió que utilizan un conjunto de datos de más de 200 horas de vídeos de plataformas 2D y entrenan un modelo mundial de 11 millones. De forma no supervisada, Genie aprende diversas acciones latentes que controlan constantemente a los personajes.

Juegos de manualidades Genie AI de Google a partir de imágenes individuales
Crédito de la foto: Google

Las capacidades del genio

Según la Google Investigadores, Genie está impulsado por tres modelos: un modelo dinámico que predice lo que sucederá en el siguiente cuadro, un tokenizador de video que convierte cuadros de video sin procesar en tokens discretos y un modelo de acción latente que puede inferir las acciones entre cuadros de video.

La capacidad del modelo fundamental de Genie para identificar el personaje principal de un juego sin tener que entrenarlo en acciones o anotaciones de texto es una de sus características únicas. Gracias a los modelos que lo impulsan, el usuario puede controlar al personaje sin esfuerzo en un Generado por IA entorno de realidad virtual.

Rocktäschel también afirmó que Genie podría convertir otros medios en juegos. Se puede pedir a Genie que cree varios mundos virtuales controlables mediante acciones a partir de diversas entradas en el artículo de investigación adjunto de Google DeepMind.

Además, Rocktäschel dijo que el modelo puede convertir cualquier imagen en un mundo 2D jugable. Según él, Genie puede dar vida a creaciones diseñadas por humanos, como bocetos, por ejemplo, hermosas obras de arte de Seneca y Caspian, dos de los creadores más jóvenes del mundo.

Sello de tiempo:

Mas de MetaNoticias