Gry Google Genie AI Crafts z pojedynczych obrazów

Gry Google Genie AI Crafts z pojedynczych obrazów

Google ogłosiło Genie, aplikację do tworzenia gier mobilnych, w ramach ciągłych inwestycji w sztuczną inteligencję. 

Generatywny model sztucznej inteligencji Genie, opracowany przez start-up Google zajmujący się sztuczną inteligencją DeepMind, zademonstrował wersję demonstracyjną na żywo. Genie uczy się mechaniki gier z setek tysięcy filmów z rozgrywką i może generować grywalne gry przy minimalnej liczbie podpowiedzi.

Przeczytaj także: Rysunek AI zgromadzi 675 milionów dolarów na humanoidalną robotykę rozwiązującą pracę

Odsłonięcie dżina

Jak stwierdzono w oficjalnym DeepMind firmy Google blogu, Genie to podstawowy model świata wytrenowany przy użyciu filmów dostępnych w Internecie. Model może stworzyć „nieskończoną różnorodność grywalnych (sterowanych akcją) światów na podstawie syntetycznych obrazów, fotografii, a nawet szkiców”.

Genie, skrót od Generative Interactive Environments, powstał we współpracy Google i Uniwersytetu Kolumbii Brytyjskiej. Za pomocą tylko jednego obrazu może generować platformówki 2D z przewijaniem bocznym, takie jak Contra i Super Mario Brothers, w oparciu o podpowiedzi użytkownika.

Jednak Google DeepMind oświadczyło podczas ogłoszenia, że ​​wprowadza „nowy paradygmat” generatywnej sztucznej inteligencji (AI) w postaci dżina. Ponadto firma zauważyła pojawienie się generatywnych modeli sztucznej inteligencji, które są w stanie generować nowatorskie i kreatywne treści za pomocą języka, obrazów, a nawet filmów.

Według Google znaczna część z 200,000 2 godzin nagrań wideo z publicznych gier internetowych, na których Genie się szkolił, to platformówki XNUMXD, a nie gry w pełnej rzeczywistości wirtualnej.

Specyfikacje Genie

Jeśli chodzi o wymiary, Genie ma 11 miliardów parametrów. W modelu uwzględniono także czasoprzestrzenny tokenizator wideo, model dynamiki autoregresyjnej oraz prosty i skalowalny model działań ukrytych. Specyfikacje te umożliwiają Genie działanie w wygenerowanych środowiskach klatka po klatce, nawet bez etykiet i innych wymagań specyficznych dla domeny podczas szkolenia.

Ponadto Genie można poinstruować, aby generował zróżnicowany zestaw interaktywnych i kontrolowanych środowisk, pomimo przeszkolenia w zakresie danych wyłącznie wideo. W przeciwieństwie do wielu generatywnych modeli sztucznej inteligencji, które mogą tworzyć kreatywne treści zawierające obrazy językowe, a nawet filmy, Genie może tworzyć grywalne środowiska za pomocą tylko jednego monitu graficznego.

Jednak programista Google DeepMind, Tim Rocktäschel, powiedział na X (dawniej Twitterze), że skupiają się na skali, a nie na dodawaniu odchyleń indukcyjnych.

Dodał, że korzystają ze zbioru danych obejmującego ponad 200 tys. godzin filmów z platformówek 2D i trenują model świata 11B. W nienadzorowany sposób Dżin uczy się różnorodnych ukrytych działań, które konsekwentnie kontrolują postacie.

Gry Google Genie AI Crafts z pojedynczych obrazów
Źródło zdjęcia: Google

Możliwości dżina

Zgodnie z Google badaczy, Genie opiera się na trzech modelach: modelu dynamicznym, który przewiduje, co stanie się w następnej klatce, tokenizatorze wideo, który zamienia surowe klatki wideo w oddzielne tokeny, oraz modelu działania ukrytego, który może wnioskować o działaniach pomiędzy klatkami wideo.

Zdolność podstawowego modelu Genie do identyfikowania głównego bohatera gry bez konieczności przeszkolenia w zakresie akcji lub adnotacji tekstowych to jedna z jego unikalnych cech. Dzięki modelom, które nim sterują, użytkownik może bez wysiłku sterować postacią w grze Wygenerowane przez AI środowisko rzeczywistości wirtualnej.

Rocktäschel powiedział również, że Genie może zamienić inne media w gry. Można poprosić Genie o utworzenie różnych wirtualnych światów, którymi można sterować za pomocą akcji, na podstawie różnych danych zawartych w załączonym artykule badawczym Google DeepMind.

Co więcej, Rocktäschel powiedział, że model może przekształcić dowolny obraz w grywalny świat 2D. Według niego Dżin może ożywiać dzieła zaprojektowane przez człowieka, takie jak szkice, na przykład piękne dzieła sztuki Seneki i Kaspiana, dwóch najmłodszych twórców na świecie.

Znak czasu:

Więcej z MetaWiadomości