Поскольку гонка за превосходство ИИ продолжается, Microsoft теперь хочет преобразовать портретные изображения людей в говорящие лица или видео с помощью своего новейшего инструмента VASA-1.
Согласно исследованию технологического гиганта, Microsoft выводит гонку искусственного интеллекта на новый уровень. ВАСА 1, основа для создания реалистичных говорящих лиц виртуальных персонажей с визуально-аффективными навыками (ВАС), все из портрета.
Читайте также: Индустрия видеоигр спешит объединиться в профсоюзы из-за искусственного интеллекта
От портретов к говорящим лицам
Хотя он еще не доступен для широкой публики, инструмент делает одну портретную фотографию и звук речи и создает гиперреалистичное видео говорящего лица с точной синхронизацией звука губ, реалистичным поведением лица и натуралистичными движениями головы, генерируемыми в реальном времени.
Инструмент все еще находится на стадии предварительного исследования исследовательской командой Microsoft, и демонстрационные видеоролики «выглядят впечатляюще».
В то время как такие компании, как Nvidia и Runway, уже имеют аналогичную технологию движения головы и синхронизации губ, VASA-1, похоже, «имеет гораздо более высокое качество и реалистичность», что уменьшает артефакты рта, по словам Руководство пользователя Tom's Guide.
Кроме того, этот подход к анимации, управляемой звуком, также похож на недавний подход. Видеоблогер ИИ Модель от Google Research.
По заявлению Microsoft, хотя все изображения в демонстрационных примерах являются синтетическими, созданными Dall-E, VASA-1 все же может анимировать реальную картинку.
Демонстрация показывает, как разные люди разговаривают с почти естественными движениями, выражениями лица, движениями глаз: «никаких артефактов вокруг верхней и нижней части рта, наблюдаемых в других инструментах».
Для работы также не требуется портретное изображение лицом вперед.
Microsoft только что представила VASA-1.
Это новая модель искусственного интеллекта, которая может превратить 1 фотографию и 1 аудиозапись в полностью реалистичную человеческую дипфейк.
Дико бросить это прямо перед выборами 😬pic.twitter.com/MuLkZVOKRM
— Роуэн Чунг (@rowancheung) 18 апреля 2024
ВАСА-1 заставил людей говорить
Энтузиасты искусственного интеллекта, кажется, уже поражены технологией, описывающей ее как «дикую» и «безумную» на платформе X.
«Улучшения, которые мы получаем между каждым выпуском, невероятны» — сказал Линус Экенстам.
Другие считают, что мир является свидетелем «сейсмического сдвига в способах создания медиаконтента» и его потребления.
«Это потрясающе, реализм на высшем уровне», — сказал другой энтузиаст по имени Сэм.
Хотя другие признают возможности этого инструмента, они также считают, что со стороны Microsoft несколько безответственно представлять инструмент, которым можно легко манипулировать в целях безопасности. предвыборные дипфейки.
«Дико отказаться от этого прямо перед выборами», писал Роуэн Чунг на платформе X.
Другой пользователь Эван Кирстел прокомментировал со строгим предупреждением: «Система VASA-1 от Microsoft Research меняет правила игры, создавая гиперреалистичные видеоролики, созданные искусственным интеллектом, из фотографий и аудио».
«Возможности безграничны: от возрождения классических легенд кино до персонализированных медиа. Но давайте будем внимательны к рискам дипфейков».
Мир уже стал свидетелем наплыва дипфейков выборов, в которых голоса или изображения политиков манипулировались с помощью ИИ для распространения пропаганды. В этом году на выборы придет около трети населения мира.
Однако исследователи из Microsoft указали, что это всего лишь демонстрация, и в настоящее время нет планов по публичному выпуску или предоставлению доступа разработчикам.
Как работает ВАСА-1?
По данным Tom's Guide, сами исследователи удивлены способностью модели «идеально синхронизировать губы с песней, без проблем отражая слова певца, несмотря на то, что в наборе обучающих данных не используется музыка».
Кроме того, VASA-1 обрабатывал различные стили изображений, включая исторические портреты, такие как знаменитый Мона Лиза.
Этот инструмент можно использовать в играх благодаря его расширенным возможностям синхронизации губ. По мнению экспертов, это может изменить правила игры в сфере погружения.
Кроме того, эта технология может сыграть важную роль в создании аватаров для видеороликов в социальных сетях, как в случае с такими фирмами, как Synthesia и HeyGen.
В фильмах и музыкальных клипах на основе искусственного интеллекта также можно использовать технологию VASA-1 для создания более реалистичных видеороликов.
Есть вероятность, что, поскольку Microsoft имеет долю в OpenAI, VASA-1 может стать частью «будущего второго пилота». Сора интеграция ».
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://metanews.com/enthusiasts-smitten-by-image-to-video-tool-vasa-1/
- :имеет
- :является
- :нет
- :куда
- 1
- 10
- 7
- 8
- a
- способности
- способность
- О нас
- По
- продвинутый
- AI
- Оповещение
- Все
- почти
- уже
- причислены
- an
- и
- Оживить
- анимация
- Другой
- подхода
- МЫ
- около
- AS
- At
- аудио
- доступен
- Аватары
- назад
- BE
- было
- до
- поведение
- не являетесь
- между
- Немного
- дующий
- Дно
- но
- by
- CAN
- случаев
- шансы
- Переключатель
- символы
- чунг
- Кино
- классический
- , имея в виду
- Компании
- потребленный
- содержание
- продолжается
- может
- создали
- Создающий
- В настоящее время
- дал-и
- deepfakes
- демонстрация
- демонстрация
- описывающих
- Несмотря на
- застройщиков
- различный
- приносит
- управляемый
- Падение
- каждый
- легко
- выборы
- Бесконечный
- энтузиаст
- энтузиастов
- Примеры
- эксперты
- выражения
- Глаза
- Face
- лица
- лицевой
- знаменитый
- Компаний
- Что касается
- Рамки
- от
- полностью
- игра
- игра-чейнджер
- игровой
- генерируется
- получающий
- гигант
- Глобальный
- будет
- есть
- инструкция
- Есть
- имеющий
- высший
- исторический
- Как
- HTTPS
- человек
- Гиперреалистичный
- идентифицированный
- изображение
- изображений
- погружение
- впечатляющий
- улучшение
- in
- В других
- В том числе
- невероятный
- указанный
- промышленность
- приток
- инструментальный
- интеграции.
- в
- вводить
- выпустили
- вопрос
- IT
- ЕГО
- JPEG
- всего
- последний
- Легенды
- уровень
- Кредитное плечо
- как живой
- такое как
- Линус
- Создание
- манипулировать
- Медиа
- Microsoft
- против
- модель
- БОЛЕЕ
- рот
- движение
- движения
- Кино
- много
- Музыка
- натуральный
- Новые
- нет
- сейчас
- Nvidia
- of
- on
- OpenAI
- or
- Другое
- Другое
- за
- бумага & картон
- часть
- Люди
- народный
- Персонализированные
- Фото
- картина
- Картинки
- кусок
- Планы
- Платформа
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- опросы
- население
- портрет
- портреты
- возможности,
- необходимость
- предварительный просмотр
- производит
- производство
- пропагандой
- что такое варган?
- Гонки
- Читать
- реальные
- реального времени
- реализм
- реалистичный
- последний
- признавать
- снижает
- отражающий
- освободить
- требовать
- исследованиям
- исследователи
- правую
- рисках,
- взлетно-посадочная полоса
- торопить
- s
- Сказал
- Сэм
- казаться
- видел
- сдвиг
- Шоу
- аналогичный
- певица
- одинарной
- навыки
- Соцсети
- социальные сети
- песня
- речь
- распространение
- Этап
- доля
- оставаться
- По-прежнему
- стиль
- удивлен
- синхронизации.
- синтетический
- принимает
- с
- говорить
- команда
- технологии
- технологический гигант
- Технологии
- который
- Ассоциация
- мир
- сами
- Там.
- они
- think
- В третьих
- этой
- В этом году
- в
- инструментом
- инструменты
- топ
- Обучение
- Transform
- правда
- ОЧЕРЕДЬ
- используемый
- Информация о пользователе
- пользователей
- через
- судно
- Видео
- Видео
- Вид
- Виртуальный
- визуальный
- ГОЛОСА
- хочет
- предупреждение
- Путь..
- который
- в то время как
- без
- свидетели
- слова
- Работа
- Мир
- X
- год
- еще
- зефирнет