Создание видео с помощью искусственного интеллекта и несколько слов: ознакомьтесь с новым инструментом Meta

Переиздано Платоном

Читают: 0

Рэйчел Мец, CNN Business

Искусственный интеллект становится все лучше и лучше в создании изображения в ответ на несколько слов с помощью общедоступных генераторов изображений ИИ, таких как DALL-E 2 и Stable Diffusion. Теперь исследователи Meta делают ИИ еще дальше: они используют его для создания видео из текстовой подсказки.

Генеральный директор Meta Марк Цукерберг опубликовал в Facebook в четверг об исследовании, называемые Сделать видео, с 20-секундным роликом, в котором собрано несколько текстовых подсказок, использованных исследователями Meta, и полученными (очень короткими) видеороликами. Подсказки включают в себя: «Плюшевый мишка рисует автопортрет», «Космический корабль приземляется на Марс», «Ленинец в вязаной шапке пытается разобраться в ноутбуке» и «Робот, бороздящий волну в океане».

Видео для каждой подсказки длится всего несколько секунд и обычно показывает то, что предлагает подсказка (за исключением детеныша ленивца, который не очень похож на настоящее существо), в довольно низком разрешении и несколько отрывистым. стиль. Тем не менее, это демонстрирует новое направление исследований ИИ, поскольку системы становятся все более эффективными в создании изображений из слов. Однако если эта технология в конечном итоге будет широко распространена, она вызовет многие из тех же опасений, которые вызывают системы преобразования текста в изображение, например, что ее можно использовать для распространения дезинформации через видео.

Веб-страница for Make-A-Video включает в себя эти и другие короткие клипы, некоторые из которых выглядят довольно реалистично, например видео, созданное в ответ на подсказку. «Рыба-клоун, плывущая по коралловому рифу» или тот, который предназначен для показа «Молодая пара гуляет под проливным дождем".

В своем посте в Facebook Цукерберг отметил, насколько сложно создать движущееся изображение из нескольких слов.

«Создавать видео гораздо сложнее, чем фотографии, потому что помимо правильной генерации каждого пикселя система также должна предсказывать, как они будут меняться с течением времени», — написал он.

Исследовательская работа В описании работы объясняется, что в проекте используется модель ИИ преобразования текста в изображение, чтобы выяснить, как слова соотносятся с изображениями, а также метод ИИ, известный как неконтролируемое обучение — в котором алгоритмы изучают данные, которые не помечены, чтобы выявить в них закономерности — чтобы просмотреть видео и определить, как выглядит реалистичное движение.

Как и в случае с массивными популярными системами искусственного интеллекта, генерирующими изображения из текста, исследователи отметили, что их модель искусственного интеллекта, преобразующая текст в изображение, была обучена на интернет-данных, а это означает, что она усвоила «и, вероятно, преувеличила социальные предубеждения, в том числе вредные», говорят исследователи. написал. Они отметили, что отфильтровали данные по «контенту NSFW и токсичным словам», но, поскольку наборы данных могут включать в себя многие миллионы изображений и текста, удалить весь такой контент может быть невозможно.

Цукерберг написал, что Meta планирует в будущем поделиться проектом Make-A-Video в качестве демо-версии.

Отметка времени: 30 сентября, 202230 сентября, 2022

Отметка времени: сентябрь 21, 2022

Переиздано Платоном

ФРС может обрушить рынок жилья

Стартап Cary по улавливанию воздуха Sustaera назначает руководителя по переработке газа новым генеральным директором

Epic оживляет архитектуру, проектирование и строительство с помощью иммерсивных инструментов

Отчеты о доходах: Bioventus, Humacyte, Guerrilla RF, Novan, Liquidia и др.

Компания по производству строительных материалов Woodgrain, расширяющаяся в Роки-Маунт, наймет больше рабочих

FTC пересматривает планы Amazon по покупке iRobot, One Medical

Apple предлагает «экстремальный» уровень безопасности — вот как его включить

Больше увольнений: Wayfair сокращает 5% своей глобальной рабочей силы

От А до Я: NC TECH называет финалистов ежегодных наград

Google Fiber с растущим охватом СК, который расширяется еще до пяти штатов.

Использование новейших технологий Apple: смотрите или слушайте инсайдерские советы от MacRumors

Богатые становятся еще богаче: США прибавляют 2.5 млн миллионеров; более 62.5 миллионов сейчас по всему миру

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись