ИИ продолжает генерировать много света и тепла. Лучшие модели в области текста и изображений, которые сейчас пользуются подпиской и используются в потребительских продуктах, соревнуются за дюймы. OpenAI, Google и Anthropic — все более или менее идут рука об руку.
Неудивительно, что исследователи ИИ стремятся вывести генеративные модели на новую территорию. Поскольку ИИ требует огромных объемов данных, один из способов спрогнозировать, как будут развиваться события дальше, — это посмотреть, какие данные широко доступны в Интернете, но все еще в значительной степени неиспользованы.
Видео, которых много, является очевидным следующим шагом. Действительно, в прошлом месяце OpenAI анонсировала новый ИИ для преобразования текста в видео под названием Sora это ошеломило зрителей.
А как насчет видео…игр?
Спросите и получите
Оказывается, в сети довольно много геймерских видеороликов. Google DeepMind утверждает, что обучила новый ИИ, Genie, на 30,000 XNUMX часах специально подобранных видеоматериалов, показывающих, как геймеры играют в простые платформеры — вспомните ранние игры Nintendo — и теперь он может создавать собственные примеры.
Genie превращает простое изображение, фотографию или эскиз в интерактивную видеоигру.
Получив подсказку, скажем, рисунок персонажа и его окружения, ИИ может затем принять данные игрока, чтобы переместить персонажа по его миру. В своем блоге DeepMind продемонстрировал творения Genie, которые перемещаются по 2D-пейзажам, ходят или прыгают между платформами. Подобно змее, пожирающей свой хвост, некоторые из этих миров были созданы на основе изображений, созданных ИИ.
В отличие от традиционных видеоигр, Genie создает интерактивные миры кадр за кадром. Получив подсказку и команду двигаться, он прогнозирует наиболее вероятные следующие кадры и создает их на лету. Он даже научился включать ощущение параллакса — распространенную особенность платформеров, где передний план движется быстрее, чем задний.
Примечательно, что обучение ИИ не включало в себя ярлыки. Скорее, Genie научилась соотносить входные команды (например, идти влево, вправо или прыгать) с внутриигровыми движениями, просто наблюдая за примерами в процессе обучения. То есть, когда персонаж в видео двигался влево, не было метки, связывающей команду с движением. Джинн догадался об этом сам. Это означает, что потенциально будущие версии можно будет обучать на таком же количестве подходящих видео, которые есть в Интернете.
ИИ является впечатляющим доказательством концепции, но он все еще находится на очень ранней стадии разработки, и DeepMind пока не планирует обнародовать модель.
Сами игры представляют собой пиксельные миры, движущиеся со скоростью один кадр в секунду. Для сравнения, современные видеоигры могут достигать 60 или 120 кадров в секунду. Кроме того, как и все генеративные алгоритмы, Genie генерирует странные или противоречивые визуальные артефакты. Он также склонен к галлюцинациям «нереалистичного будущего». команда написала в своей статье, описывая ИИ.
Тем не менее, есть несколько причин полагать, что Genie станет лучше.
Взрывные миры
Поскольку ИИ может учиться на неразмеченных онлайн-видео и по-прежнему имеет скромные размеры — всего 11 миллиардов параметров, — у него есть широкие возможности для масштабирования. Более крупные модели, обученные на большем количестве информации, имеют тенденцию значительно улучшаться. И с растущая индустрия, ориентированная на логические выводы— процесс, с помощью которого обученный ИИ выполняет такие задачи, как генерация изображений или текста, — вероятно, станет быстрее.
DeepMind утверждает, что Genie может помочь людям, например, профессиональным разработчикам, создавать видеоигры. Но, как и в случае с OpenAI, которая считает, что Sora — это нечто большее, чем просто видео, команда думает шире. Этот подход может выйти далеко за рамки видеоигр.
Один пример: ИИ, который может управлять роботами. Команда на видео обучила отдельную модель роботизированных рук, выполняющих различные задачи. Модель научилась управлять роботами и обращаться с различными объектами.
DeepMind также заявила, что созданную Genie среду видеоигр можно использовать для обучения агентов искусственного интеллекта. Это не новая стратегия. В статье 2021 года еще один Команда DeepMind представила видеоигру под названием Xland он был населен агентами ИИ и повелителем ИИ, генерирующим задания и игры, чтобы бросить им вызов. Идея о том, что следующий большой шаг в развитии ИИ потребует алгоритмов, которые смогут обучать друг друга или генерировать синтетические обучающие данные, является получение тяги.
Все это — последний залп в напряженной конкуренции между OpenAI и Google за демонстрацию прогресса в области искусственного интеллекта. В то время как другие в этой области, как антропный, продвигают мультимодальные модели, подобные GPT-4, Google и OpenAI, похоже, также сосредоточены на алгоритмах, моделирующих мир. Такие алгоритмы могут быть лучше при планировании и взаимодействии. И то, и другое будет иметь решающее значение для агентов ИИ, которые обе организации, судя по всему, намерены создавать.
«Джинну можно подсказывать изображения, которые он никогда раньше не видел, например, фотографии или эскизы реального мира, что позволяет людям взаимодействовать с воображаемыми виртуальными мирами — по сути, выступая в качестве базовой модели мира», — пишут исследователи в Сообщение в блоге Джина. «Мы ориентируемся на видео 2D платформеров и робототехники но наш метод является общим и должен работать для любого типа домена, а также масштабируется для все более крупных наборов интернет-данных».
Точно так же, когда в прошлом месяце OpenAI анонсировала Sora, исследователи предположили, что она может предвещать нечто более фундаментальное: симулятор мира. То есть обе команды, похоже, рассматривают огромный кеш онлайн-видео как способ научить ИИ генерировать собственное видео, да, но также и более эффективно понимать и действовать в мире, онлайн или оффлайн.
Приносит ли это дивиденды или является устойчивым в долгосрочной перспективе, остается открытым вопросом. Человеческий мозг работает на мощности лампочки; генеративный ИИ использует целые центры обработки данных. Но лучше не недооценивать силы, действующие сейчас – с точки зрения талантов, технологий, умов и денег – стремясь не только улучшить ИИ, но и сделать его более эффективным.
Мы увидели впечатляющий прогресс в тексте, изображениях, аудио и во всех трех вместе взятых. Видео — это следующий ингредиент, который добавляют в котел, и из них может получиться еще более крепкий напиток.
Изображение Фото: Google DeepMind
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://singularityhub.com/2024/03/07/a-google-ai-watched-30000-hours-of-video-games-now-it-makes-its-own/
- :имеет
- :является
- :нет
- :куда
- $UP
- 000
- 11
- 120
- 2021
- 2D
- 30
- 60
- a
- О нас
- действующий
- опережения
- агенты
- AI
- родственный
- алгоритмы
- Все
- причислены
- суммы
- an
- и
- Другой
- Антропный
- любой
- отношение
- подхода
- МЫ
- оружие
- около
- AS
- At
- аудио
- доступен
- фон
- BE
- до
- не являетесь
- верить
- считает,
- ЛУЧШЕЕ
- Лучшая
- между
- Beyond
- большой
- больший
- миллиард
- Блог
- изоферменты печени
- Мозг
- но
- by
- Кэш
- под названием
- CAN
- Центры
- вызов
- персонаж
- Общий
- сравнение
- конкурирующий
- конкурс
- комплектующие
- сама концепция
- потребитель
- современный
- продолжается
- контраст
- контроль
- может
- Создайте
- создает
- творения
- кредит
- решающее значение
- Куратор
- данным
- центров обработки данных
- Наборы данных
- DeepMind
- описывающих
- застройщиков
- Развитие
- дивиденды
- домен
- драматично
- рисование
- Рано
- фактически
- эффективный
- позволяет
- огромный
- средах
- Даже
- НИКОГДА
- пример
- Примеры
- быстрее
- Особенность
- несколько
- поле
- фигурный
- Фокус
- внимание
- Что касается
- Войска
- Прогноз
- Год основания
- основополагающий
- КАДР
- от
- будущее
- Фьючерсная торговля
- игра
- Геймеры
- Игры
- Общие
- порождать
- генерирует
- порождающий
- генеративный
- Генеративный ИИ
- Джинн
- получить
- данный
- Go
- будет
- google ai
- обрабатывать
- помощь
- здесь
- Удар
- ЧАСЫ
- HTTPS
- человек
- идея
- изображение
- изображений
- представить
- впечатляющий
- улучшать
- in
- в игре
- включают
- действительно
- промышленность
- информация
- вход
- интенсивный
- намерение
- взаимодействовать
- взаимодействие
- интерактивный
- Интернет
- в
- IT
- ЕГО
- саму трезвость
- этикетка
- Этикетки
- пейзажи
- в значительной степени
- больше
- Фамилия
- последний
- УЧИТЬСЯ
- узнали
- оставил
- Меньше
- легкий
- такое как
- Вероятно
- связывающий
- Длинное
- посмотреть
- искать
- сделать
- ДЕЛАЕТ
- Май..
- означает
- метод
- может быть
- модель
- Модели
- скромный
- Месяц
- БОЛЕЕ
- более эффективным
- самых
- движение
- двигаться
- переехал
- движения
- движется
- много
- навигационный
- никогда
- Новые
- следующий
- Nintendo
- нет
- объекты
- Очевидный
- of
- от
- on
- ONE
- онлайн
- только
- открытый
- OpenAI
- работать
- работает
- Возможность
- or
- организации
- Другое
- наши
- внешний
- изложенные
- собственный
- бумага & картон
- часть
- страна
- Люди
- для
- выполняет
- Фото
- фотографии
- планирование
- Платформы
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- Играть
- игрок
- игры
- Много
- населенный
- После
- мощный
- потенциально
- мощностью
- предсказывает
- процесс
- производства
- профессиональный
- Прогресс
- доказательство
- доказательство концепции
- что такое варган?
- Push
- вопрос
- вполне
- скорее
- реальные
- реальный мир
- причины
- требовать
- требуется
- исследователи
- правую
- Роботы
- Сказал
- сообщили
- говорит
- масштабируемые
- Шкала
- Во-вторых
- казаться
- видел
- смысл
- отдельный
- должен
- показывать
- показал
- показ
- просто
- просто
- имитировать
- имитатор
- навыки
- некоторые
- удалось
- источников
- Шаг
- По-прежнему
- странный
- Стратегия
- потоковый
- подписка
- такие
- сюрприз
- комфортного
- синтетический
- взять
- Талант
- задачи
- команда
- команды
- технологии
- Тенденцию
- срок
- terms
- территория
- текст
- чем
- который
- Ассоциация
- мир
- их
- Их
- сами
- тогда
- Там.
- Эти
- они
- вещи
- мышление
- этой
- три
- Через
- в
- вместе
- традиционный
- Train
- специалистов
- Обучение
- Получается
- напишите
- понимать
- неиспользованный
- используемый
- использования
- разнообразие
- различный
- версии
- очень
- Видео
- видеоигра
- видеоигры
- Видео
- Вид
- Виртуальный
- визуальный
- ходьба
- законопроект
- Просмотров
- Путь..
- ЧТО Ж
- были
- Что
- когда
- который
- в то время как
- все
- широко
- будете
- Работа
- Мир
- мире
- стоимость
- писал
- Да
- еще
- зефирнет