A Meta bemutatja a következő generációs AI Emu videót és az Emu Editet

A Meta bemutatja a következő generációs AI Emu videót és az Emu Editet

Meta Unveils Next-Gen AI Emu Video and Emu Edit PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A generatív mesterséges intelligencia birodalma gyors fejlődésről tanúskodik, és 2023 jelentős előrelépést jelent ezen a területen. A Meta, korábban Facebook, bemutatta az Emu-t, a képgenerálás úttörő alapmodelljét az idei Meta Connect eseményen. Ez technológia számos mesterséges intelligencia tapasztalatot támaszt alá a Meta alkalmazáscsaládjában, különösen az Instagram AI képszerkesztő eszközeiben. Ezek az eszközök lehetővé teszik a felhasználók számára, hogy átalakítsák fényképeiket vizuális stílusuk vagy hátterük megváltoztatásával. Ezenkívül a Meta AI Imagine funkciója megkönnyíti a fotorealisztikus képek létrehozását üzenetekben vagy csoportos csevegésekben.

Áttörés a videógenerálásban: Emu videó

Az Emu Video kulcsfontosságú fejlesztésként jelenik meg, amely az Emu modellt használja a szövegből videóvá generáláshoz. Ez a diffúziós modelleken alapuló innovatív megközelítés egyszerű, de hatékony módszert kínál kiváló minőségű videók készítésére. A folyamat két fázisból áll: kezdetben képek generálása szöveges promptokból, majd ezt követően szöveges és képi feltételű videók létrehozása. Ez a faktorizált módszertan lehetővé teszi a videógenerációs modellek hatékony betanítását. Az Emu Video felsőbbrendűsége nyilvánvaló, hiszen mindössze két diffúziós modellre van szükség ahhoz, hogy 512×512-es videókat készítsen 16 fps-en, ami éles ellentétben áll a korábbi, több modellt igénylő módszerekkel. Emberi értékelések azt mutatják, hogy az Emu Video-t előnyben részesítik, teljesítménye felülmúlja a korábbi technológiákat mind minőségben, mind a szöveges felszólítások betartásában.

Forradalmasító képszerkesztés: Emu Edit

A Meta Emu Edit paradigmaváltást jelent a képszerkesztésben, a precíz pixelszintű változtatásokra összpontosítva. Ez az eszköz bonyolult szerkesztési feladatokat tesz lehetővé, például helyi és globális módosításokat, háttérbeállításokat, valamint szín- és geometriai átalakításokat. Az Emu Edit kiemelkedik azzal, hogy biztosítja, hogy csak a szerkesztési utasításokhoz kapcsolódó képpontok változzanak, megőrizve a kép nem célzott részei integritását. Az Emu Edit betanítására a Meta kiterjedt adatkészletet fejlesztett ki, amely 10 millió szintetizált mintát tartalmaz, amelyek mindegyike tartalmaz egy bemeneti képet, egy szerkesztési feladat leírását és a célzott kimeneti képet. A modell kivételes teljesítményt mutat az utasításhűség és a képminőség tekintetében.

A generatív AI jövője a Metában

A generatív mesterséges intelligencia ezen fejlesztései egy olyan jövőre utalnak, ahol a kreatív kifejezés könnyebben hozzáférhető és változatosabb. Az Emu Video és az Emu Edit forradalmasíthatja a média létrehozását és megosztását. Eszközöket kínálnak a professzionális művészektől az alkalmi felhasználókig mindenki számára, lehetővé téve a kifejezés és a kreativitás új formáit. Bár nem helyettesítik a professzionális alkotókat, platformot biztosítanak a fokozott önkifejezéshez és a kreatív felfedezéshez.

A médiajelentések hangsúlyozzák az Emu Video egyszerűsített folyamatát és az Emu Edit precíz pixel szintű szerkesztési képességét. A technológia egyszerűségét és hatékonyságát emelik ki, valamint a videó- ​​és képszerkesztés forradalmasításának lehetőségét. A Meta azonban óvatosan közelíti meg az AI-megoldások bevezetését, tekintettel a szabályozók szigorú ellenőrzésére. A Meta egyértelművé tette, hogy mesterséges intelligencia-képességei nem lesznek elérhetők marketing- vagy politikai kampányokhoz a Facebookon és az Instagramon. Ennek ellenére a platform alapvető hirdetési szabályozása jelenleg nem foglalkozik kifejezetten az AI-val.

Képforrás: Shutterstock

Időbélyeg:

Még több Blockchain News