Meta представляє наступне покоління Emu Video та Emu Edit

Meta представляє наступне покоління Emu Video та Emu Edit

Meta представляє наступне покоління AI Emu Video та Emu Edit PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Сфера генеративного штучного інтелекту стрімко розвивається, і 2023 рік став значним кроком у цій галузі. Meta, колишня Facebook, представила Emu, новаторську базову модель для створення зображень, на цьогорічному заході Meta Connect. Це technology лежить в основі численних технологій штучного інтелекту в сімействі програм Meta, зокрема в інструментах редагування зображень штучного інтелекту Instagram. Ці інструменти дозволяють користувачам трансформувати фотографії, змінюючи їх візуальний стиль або фон. Крім того, функція Imagine у ​​Meta AI полегшує створення фотореалістичних зображень у повідомленнях або групових чатах.

Прорив у генерації відео: Emu Video

Emu Video стає ключовою розробкою, яка використовує модель Emu для створення тексту у відео. Цей інноваційний підхід, заснований на дифузійних моделях, пропонує простий, але ефективний метод створення високоякісних відео. Процес складається з двох етапів: початкове створення зображень із текстових підказок, а потім створення відео на основі тексту та зображень. Ця факторизована методологія дозволяє ефективно навчати моделі створення відео. Перевага Emu Video очевидна, оскільки для створення відео 512 × 512 зі швидкістю 16 кадрів в секунду потрібні лише дві дифузійні моделі, що різко контрастує з попередніми методами, які вимагали кількох моделей. Оцінки людей показали сильну перевагу Emu Video, її продуктивність перевершує попередні технології як за якістю, так і за дотриманням текстових підказок.

Революційне редагування зображень: Emu Edit

Emu Edit від Meta представляє зміну парадигми редагування зображень, зосереджуючись на точних змінах на рівні пікселів. Цей інструмент дозволяє виконувати такі складні завдання редагування, як локальні та глобальні зміни, коригування фону, колірні та геометричні перетворення. Emu Edit виділяється тим, що змінює лише пікселі, які відповідають інструкціям редагування, зберігаючи цілісність нецільових частин зображення. Щоб навчити Emu Edit, Meta розробила великий набір даних, що включає 10 мільйонів синтезованих зразків, кожен з яких включає вхідне зображення, опис завдання редагування та цільове вихідне зображення. Модель демонструє виняткову продуктивність щодо точності інструкцій і якості зображення.

Майбутнє генеративного ШІ в Meta

Ці досягнення в генеративному штучному інтелекті натякають на майбутнє, де творче самовираження стане більш доступним і різноманітним. Emu Video та Emu Edit потенційно можуть кардинально змінити спосіб створення та обміну медіафайлами. Вони пропонують інструменти для всіх, від професійних художників до звичайних користувачів, створюючи нові форми вираження та творчості. Хоча вони не замінюють професійних творців, вони надають платформу для покращеного самовираження та творчого пошуку.

У звітах ЗМІ підкреслюється спрощений процес Emu Video та можливість точного редагування на рівні пікселів Emu Edit. Підкреслюється простота й ефективність цієї технології, а також її потенціал революціонізувати редагування відео та зображень. Однак Meta обережно підходить до розгортання цих рішень штучного інтелекту, враховуючи суворий контроль з боку регуляторів. Meta уточнила, що її можливості ШІ не будуть доступні для маркетингових або політичних кампаній у Facebook та Instagram. Тим не менш, базові правила реклами платформи наразі не стосуються спеціально ШІ.

Джерело зображення: Shutterstock

Часова мітка:

Більше від Блокчай Новини