ШІ продовжує генерувати багато світла та тепла. Найкращі моделі в тексті та зображеннях, які зараз викликають підписку та вплетені в споживчі товари, змагаються за дюйми. OpenAI, Google і Anthropic — усі вони більш-менш схожі.
Тому не дивно, що дослідники штучного інтелекту прагнуть просунути генеративні моделі на нову територію. Оскільки штучному інтелекту потрібен величезний обсяг даних, один із способів передбачити подальший розвиток подій — це подивитися, які дані широко доступні в Інтернеті, але ще значною мірою не використовуються.
Очевидним наступним кроком є відео, якого є чимало. Дійсно, минулого місяця відбувся попередній перегляд OpenAI новий ШІ для перетворення тексту у відео під назвою Sora що приголомшило глядачів.
Але як щодо відео…ігор?
Запитай і отримуй
Виявилося, що в Інтернеті є досить багато геймерських відео. Google DeepMind каже, що навчив новий штучний інтелект, Genie, на 30,000 XNUMX годинах підібраного відеоматеріалу, на якому гравці грають у прості платформери — наприклад, ранні ігри Nintendo — і тепер він може створювати власні приклади.
Genie перетворює просте зображення, фотографію чи ескіз на інтерактивну відеогру.
Отримавши підказку, скажімо, малюнок персонажа та його оточення, ШІ може отримати дані від гравця, щоб перемістити персонажа через його світ. У дописі в блозі DeepMind показав, як творіння Genie переміщуються 2D-ландшафтами, гуляють або стрибають між платформами. Подібно до змії, яка їсть свій хвіст, деякі з цих світів навіть були отримані із зображень, створених ШІ.
На відміну від традиційних відеоігор, Genie створює ці інтерактивні світи кадр за кадром. Отримавши підказку та команду рухатися, він передбачає найімовірніші наступні кадри та створює їх на льоту. Він навіть навчився включати відчуття паралакса, типову особливість платформерів, де передній план рухається швидше, ніж фон.
Примітно, що навчання ШІ не включало міток. Швидше за все, Genie навчився співвідносити команди введення, наприклад, йти ліворуч, праворуч або стрибнути, з рухами в грі, просто спостерігаючи за прикладами під час навчання. Тобто, коли персонаж у відео рухався ліворуч, не було мітки, яка б пов’язувала команду з рухом. Джин зрозумів цю частину сам. Це означає, що потенційно майбутні версії можна навчати на стільки відповідних відео, скільки є в Інтернеті.
Штучний інтелект є вражаючим доказом концепції, але він все ще знаходиться на ранній стадії розробки, і DeepMind поки не планує оприлюднювати модель.
Самі ігри — це піксельні світи, що передаються зі швидкістю один кадр за секунду. Для порівняння, сучасні відеоігри можуть досягати 60 або 120 кадрів в секунду. Крім того, як і всі генеративні алгоритми, Genie генерує дивні або непослідовні візуальні артефакти. Він також схильний до галюцинацій «нереалістичного майбутнього», команда написала у своїй статті, описуючи ШІ.
Тим не менш, є кілька причин вважати, що Genie покращиться з цього моменту.
Збивання світів
Оскільки штучний інтелект може вивчати онлайн-відео без міток і все ще має скромний розмір (лише 11 мільярдів параметрів), є широкі можливості для розширення. Більші моделі, навчені більшій кількості інформації, мають тенденцію до різкого покращення. І з а зростаюча галузь, зосереджена на висновках— процес, за допомогою якого навчений штучний інтелект виконує завдання, як-от генерування зображень або тексту — він, імовірно, стане швидшим.
DeepMind каже, що Genie може допомогти людям, наприклад професійним розробникам, створювати відеоігри. Але, як і OpenAI, яка вважає, що Sora — це щось більше, ніж відео, — команда думає ширше. Цей підхід може вийти далеко за межі відеоігор.
Один приклад: AI, який може керувати роботами. Команда навчила окрему модель на відео роботів, які виконують різні завдання. Модель навчилася маніпулювати роботами і поводитися з різними предметами.
DeepMind також сказав, що створене Genie середовище відеоігор можна використовувати для навчання агентів ШІ. Це не нова стратегія. У документі за 2021 рік ще один Команда DeepMind розробила відеогру під назвою XLand який був населений агентами штучного інтелекту та володарем штучного інтелекту, який створював завдання та ігри, щоб кинути їм виклик. Ідея про те, що для наступного великого кроку в ШІ знадобляться алгоритми, які зможуть навчати один одного або генерувати синтетичні навчальні дані. набирає тягу.
Все це — останній залп у напруженій конкуренції між OpenAI і Google за демонстрацію прогресу в ШІ. Поки інші в полі, як Антропік, просувають мультимодальні моделі, схожі на GPT-4, Google і OpenAI також зосереджені на алгоритмах, які моделюють світ. Такі алгоритми можуть бути кращими в плануванні та взаємодії. Обидва будуть ключовими навичками для агентів штучного інтелекту, які обидві організації мають намір виробляти.
«Genie може отримувати зображення, яких він ніколи раніше не бачив, наприклад фотографії або ескізи реального світу, що дозволяє людям взаємодіяти з їхніми уявними віртуальними світами — по суті, діючи як базова модель світу», — пишуть дослідники в Допис у блозі Genie. «Ми зосереджуємося на відео про 2D-платформер і робототехніку але наш метод є загальним і повинен працювати для будь-якого типу домену, і його можна масштабувати до все більших наборів даних в Інтернеті».
Подібним чином, коли минулого місяця OpenAI попередньо провів Sora, дослідники припустили, що це може стати провісником чогось більш фундаментального: симулятора світу. Тобто обидві команди, схоже, розглядають величезний кеш онлайн-відео як спосіб навчити штучний інтелект створювати власне відео, так, але також для більш ефективного розуміння та роботи у світі, онлайн чи поза ним.
Питання, чи принесе це дивіденди, чи є стійким у довгостроковій перспективі, залишається відкритим. Людський мозок працює на потужність лампочки; генеративний ШІ використовує цілі центри обробки даних. Але краще не недооцінювати сили, які діють зараз — з точки зору таланту, технологій, розуму та грошей — щоб не лише покращити ШІ, але й зробити його ефективнішим.
Ми побачили вражаючий прогрес у тексті, зображеннях, аудіо та всіх трьох разом. Відео є наступним інгредієнтом, який кидають у каструлю, і вони можуть стати ще потужнішим напоєм.
Зображення Фото: Google DeepMind
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://singularityhub.com/2024/03/07/a-google-ai-watched-30000-hours-of-video-games-now-it-makes-its-own/
- : має
- :є
- : ні
- :де
- $UP
- 000
- 11
- 120
- 2021
- 2D
- 30
- 60
- a
- МЕНЮ
- діючий
- просування
- агенти
- AI
- подібний
- алгоритми
- ВСІ
- Також
- суми
- an
- та
- Інший
- Антропний
- будь-який
- застосовно
- підхід
- ЕСТЬ
- зброю
- навколо
- AS
- At
- аудіо
- доступний
- фон
- BE
- перед тим
- буття
- Вірити
- вважає,
- КРАЩЕ
- Краще
- між
- За
- Великий
- більший
- Мільярд
- Блог
- обидва
- Brain
- але
- by
- Кеш
- званий
- CAN
- Центри
- виклик
- характер
- загальний
- порівняння
- конкурують
- конкурс
- завершення
- концепція
- споживач
- сучасний
- триває
- контрастність
- контроль
- може
- створювати
- створює
- творіння
- кредит
- вирішальне значення
- Куратор
- дані
- центрів обробки даних
- набори даних
- Deepmind
- описують
- розробників
- розробка
- дивіденди
- домен
- різко
- малювання
- Рано
- фактично
- ефективний
- дозволяє
- величезний
- середовищах
- Навіть
- НІКОЛИ
- приклад
- Приклади
- швидше
- особливість
- кілька
- поле
- розібрався
- Сфокусувати
- увагу
- для
- Війська
- Прогноз
- фонд
- фундаментальні
- FRAME
- від
- майбутнє
- Ф'ючерси
- гра
- Геймери
- Games
- Загальне
- породжувати
- генерує
- породжує
- генеративний
- Генеративний ШІ
- джин
- отримати
- даний
- Go
- буде
- у вас є гугл
- обробляти
- допомога
- тут
- хіт
- ГОДИННИК
- HTTPS
- людина
- ідея
- зображення
- зображень
- уявляли
- вражаючий
- удосконалювати
- in
- у грі
- включати
- дійсно
- промисловість
- інформація
- вхід
- інтенсивний
- намір
- взаємодіяти
- взаємодія
- інтерактивний
- інтернет
- в
- IT
- ЙОГО
- сам
- етикетка
- етикетки
- пейзажі
- в значній мірі
- більше
- останній
- останній
- УЧИТЬСЯ
- вчений
- залишити
- менше
- світло
- як
- Ймовірно
- Зв'язуючий
- Довго
- подивитися
- шукати
- зробити
- РОБОТИ
- Може..
- засоби
- метод
- може бути
- модель
- Моделі
- скромний
- місяць
- більше
- більш ефективний
- найбільш
- рух
- рухатися
- переїхав
- руху
- рухається
- багато
- навігація
- ніколи
- Нові
- наступний
- Nintendo
- немає
- об'єкти
- Очевидний
- of
- від
- on
- ONE
- онлайн
- тільки
- відкрити
- OpenAI
- працювати
- працює
- Можливість
- or
- організації
- інші
- наші
- з
- викладені
- власний
- Папір
- частина
- країна
- Люди
- для
- виступає
- фото
- фотографії
- планування
- Платформи
- plato
- Інформація про дані Платона
- PlatoData
- Play
- гравець
- ігри
- Plenty
- заселений
- пошта
- сильнодіючий
- потенційно
- влада
- Прогнози
- процес
- виробництво
- професійний
- прогрес
- доказ
- доказ концепції
- громадськість
- Штовхати
- питання
- досить
- швидше
- реальний
- Реальний світ
- Причини
- вимагати
- Вимагається
- Дослідники
- право
- роботи
- Зазначений
- say
- говорить
- масштабовані
- шкала
- другий
- здається
- бачив
- сенс
- окремий
- Повинен
- Показувати
- показав
- показ
- простий
- просто
- імітувати
- симулятор
- навички
- деякі
- що в сім'ї щось
- джерело
- Крок
- Як і раніше
- дивний
- Стратегія
- потоковий
- підписки
- такі
- сюрприз
- сталого
- синтетичний
- Приймати
- талант
- завдання
- команда
- команди
- технології
- як правило,
- термін
- terms
- територія
- текст
- ніж
- Що
- Команда
- світ
- їх
- Їх
- самі
- потім
- Там.
- Ці
- вони
- речі
- Мислення
- це
- три
- через
- до
- разом
- традиційний
- поїзд
- навчений
- Навчання
- повороти
- тип
- розуміти
- невикористані
- використовуваний
- використовує
- різноманітність
- різний
- версії
- дуже
- Відео
- відеогра
- відеоігри
- Відео
- вид
- Віртуальний
- візуальний
- ходьба
- було
- Дивився
- шлях..
- ДОБРЕ
- були
- Що
- коли
- який
- в той час як
- всі
- широко
- волі
- з
- Work
- світ
- світі
- вартість
- пише
- так
- ще
- зефірнет