Genie AI від Google Crafts Games з окремих зображень

Genie AI від Google Crafts Games з окремих зображень

Google анонсувала Genie, додаток для створення мобільних ігор, як частину своїх постійних інвестицій у штучний інтелект. 

Генеруюча AI-модель Genie, розроблена AI-стартапом від Google DeepMind, продемонструвала живу демонстрацію. Genie вивчає ігрову механіку із сотень тисяч ігрових відео та може створювати ігри, у які можна грати, з мінімальними підказками.

Також читайте: Фігурний штучний інтелект залучить 675 мільйонів доларів для робототехніки-гуманоїда, що вирішує завдання

Відкриття Genie

Як йдеться в офіційному DeepMind від Google блог, Genie є основоположною світовою моделлю, яка навчається за допомогою онлайн-відео. «Нескінченна різноманітність ігрових (керованих діями) світів із синтетичних зображень, фотографій і навіть ескізів» може створити модель.

Genie, скорочення від Generative Interactive Environments, було розроблено у партнерстві між Google та Університетом Британської Колумбії. За допомогою всього лише одного зображення він може генерувати 2D-платформери з бічною прокруткою, такі як Contra та Super Mario Brothers, на основі підказок користувача.

Однак під час анонсу Google DeepMind заявив, що представляє «нову парадигму» для генеративного штучного інтелекту (ШІ) у формі Genie. Крім того, компанія визнала появу генеративних моделей штучного інтелекту, здатних генерувати новий і творчий контент за допомогою мови, зображень і навіть відео.

Згідно з даними Google, значна частина з 200,000 2 годин неконтрольованих публічних ігор в Інтернеті, на яких навчався Genie, є XNUMXD-платформерами, а не повними іграми віртуальної реальності.

Технічні характеристики Genie

Що стосується розмірів, Genie нараховує 11 мільярдів параметрів. Просторово-часовий відеотокенизатор, модель авторегресійної динаміки та проста та масштабована модель прихованої дії також включені в модель. Ці специфікації дозволяють Genie діяти в створених середовищах кадр за кадром, навіть без міток або інших вимог до домену під час навчання.

Крім того, Genie можна доручити створювати різноманітний набір інтерактивних та керованих середовищ, незважаючи на те, що він навчався лише на відеоданих. На відміну від численних генеративних моделей штучного інтелекту, які можуть створювати креативний контент із мовними зображеннями та навіть відео, Genie може створювати ігрові середовища лише за допомогою одного зображення.

Однак розробник Google DeepMind Тім Роктешель сказав на X (раніше Twitter), що вони зосереджені на масштабі, а не на додаванні індуктивних упереджень.

Він додав, що вони використовують набір даних із понад 200 тисяч годин відео з 2D-платформерів і тренують модель світу 11B. У неконтрольований спосіб Джин вивчає різноманітні приховані дії, які постійно контролюють персонажів.

Genie AI від Google Crafts Games з окремих зображень
Фотографія: Google

Можливості Genie

За оцінками Google Дослідники Genie керуються трьома моделями: динамічною моделлю, яка передбачає, що станеться в наступному кадрі, відеотокенізатором, який перетворює необроблені відеокадри на окремі маркери, і моделлю прихованої дії, яка може робити висновок про дії між відеокадрами.

Здатність базової моделі Genie ідентифікувати основного персонажа гри без навчання дії чи текстових анотацій є однією з її унікальних особливостей. Завдяки моделям, які керують ним, користувач може легко контролювати персонажа в Згенерований ШІ середовище віртуальної реальності.

Роктешель також сказав, що Genie може перетворити інші засоби масової інформації на ігри. Genie можна попросити створити різноманітні керовані діями віртуальні світи з різних вхідних даних у супровідній дослідницькій статті Google DeepMind.

Крім того, Rocktäschel сказав, що модель може перетворити будь-яке зображення в 2D-світ, придатний для гри. За його словами, Genie може втілити в життя створені людиною творіння, такі як ескізи, наприклад, прекрасні твори мистецтва Сенеки та Каспіана, двох наймолодших творців у світі.

Часова мітка:

Більше від МетаНовини