Google's Genie AI Crafts-spellen van afzonderlijke afbeeldingen

Google's Genie AI Crafts-spellen van afzonderlijke afbeeldingen

Google heeft Genie aangekondigd, een app voor het maken van mobiele games, als onderdeel van zijn voortdurende investeringen in kunstmatige intelligentie. 

Het generatieve AI-model Genie, ontwikkeld door Google's AI-startup DeepMind, demonstreerde een live demo. Genie leert de spelmechanismen van honderdduizenden gameplay-video's en kan met minimale aanwijzingen speelbare games genereren.

Lees ook: Figuur AI gaat $675 miljoen ophalen voor Labour-Solving Humanoid Robotics

Onthulling van geest

Zoals vermeld in Google's officiële DeepMind blogpost, Genie is een fundamenteel wereldmodel dat is getraind met behulp van online video's. “Een eindeloze verscheidenheid aan speelbare (actie-controleerbare) werelden, van synthetische afbeeldingen, foto’s en zelfs schetsen” kan door het model worden geproduceerd.

Genie, een afkorting van Generative Interactive Environments, is ontwikkeld in samenwerking tussen Google en de University of British Columbia. Met slechts één afbeelding kan het side-scrolling 2D-platformgames zoals Contra en Super Mario Brothers genereren op basis van gebruikersprompts.

Google DeepMind verklaarde echter tijdens de aankondiging dat het een “nieuw paradigma” introduceert voor generatieve kunstmatige intelligentie (AI) in de vorm van Genie. Bovendien erkende het bedrijf de opkomst van generatieve AI-modellen die nieuwe en creatieve inhoud kunnen genereren via taal, afbeeldingen en zelfs video's.

Volgens Google is een aanzienlijk deel van de 200,000 uur aan onbewaakte openbare internetgamevideo's waarvoor Genie is getraind 2D-platformgames in plaats van volledige virtual reality-games.

Specificaties van Genie

Als het om afmetingen gaat, staat Genie op 11 miljard parameters. Een spatiotemporele videotokenizer, een autoregressief dynamisch model en een eenvoudig en schaalbaar latent actiemodel zijn ook in het model opgenomen. Dankzij deze specificaties kan Genie frame voor frame in gegenereerde omgevingen handelen, zelfs zonder labels of andere domeinspecifieke vereisten tijdens het trainen.

Bovendien kan Genie worden geïnstrueerd om een ​​diverse reeks interactieve en bestuurbare omgevingen te genereren, ondanks dat hij is getraind op alleen videogegevens. Genie kan speelbare omgevingen maken met slechts één afbeeldingsprompt, in tegenstelling tot talloze generatieve AI-modellen die creatieve inhoud kunnen produceren met taalafbeeldingen en zelfs video's.

Google DeepMind-ontwikkelaar Tim Rocktäschel zei echter op X (voorheen Twitter) dat ze zich richten op schaal in plaats van het toevoegen van inductieve vooroordelen.

Hij voegde eraan toe dat ze een dataset van meer dan 200 uur aan video's van 2D-platformgames gebruiken en een 11B-wereldmodel trainen. Op een manier zonder toezicht leert Genie diverse latente acties die karakters consequent beheersen.

Google's Genie AI Crafts-spellen van afzonderlijke afbeeldingen
Fotokrediet: Google

De capaciteiten van de geest

Think Kopen Google Reviews onderzoekers wordt Genie aangestuurd door drie modellen: een dynamisch model dat voorspelt wat er in het volgende frame zal gebeuren, een videotokenizer die ruwe videoframes omzet in afzonderlijke tokens, en een latent actiemodel dat de acties tussen videoframes kan afleiden.

Het vermogen van Genie's fundamentele model om het primaire personage van een game te identificeren zonder getraind te zijn in actie of tekstannotaties, is een van de unieke kenmerken ervan. Dankzij de modellen die hem aandrijven, kan de gebruiker het personage moeiteloos besturen in een AI-gegenereerd virtual reality-omgeving.

Rocktäschel zei ook dat Genie andere media in games zou kunnen veranderen. Genie kan worden gevraagd om verschillende actie-controleerbare virtuele werelden te creëren op basis van verschillende inputs in het begeleidende Google DeepMind-onderzoekspaper.

Bovendien zei Rocktäschel dat het model elk beeld kan omzetten in een speelbare 2D-wereld. Volgens hem kan Genie door mensen ontworpen creaties tot leven brengen, zoals schetsen en bijvoorbeeld prachtige kunstwerken van Seneca en Caspian, twee van de jongste wereldscheppers ooit.

Tijdstempel:

Meer van MetaNieuws