A felhasználókat lenyűgözte a Microsoft Image to Video Tool - VASA-

A felhasználókat lenyűgözte a Microsoft Image to Video Tool – VASA-

Felhasználók, akiket lenyűgözött a Microsoft Image to Video Tool eszköze – VASA – PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

Ahogy a mesterséges intelligencia fölényéért folytatott verseny folytatódik, a Microsoft legújabb eszközével, a VASA-1-gyel szeretné az emberek portréképeit beszélő arcokká vagy videókká alakítani.

A technológiai óriás kutatási tanulmánya szerint a Microsoft egy újabb szintre emeli az AI-versenyt, azzal VASA 1, keretrendszer vizuális affektív képességekkel (VAS) rendelkező virtuális karakterek élethű beszélő arcainak létrehozásához, mindezt portréból.

Lásd még: A videojáték-ipar rohanás az AI feletti egyesülés felé

A portréktól a beszélő arcokig

Bár még nem elérhető a nyilvánosság számára, az eszköz egyetlen portréfotót és beszédhangot készít, és hiperrealisztikus beszélő arcvideót készít precíz ajak-audio szinkronnal, élethű arcviselkedéssel és valós időben generált naturalisztikus fejmozdulatokkal.

Az eszköz még mindig a kutatás előnézeti szakaszában van a Microsoft Research csapatával, és a bemutató videók „lenyűgözőnek tűnnek”.

Míg az olyan cégek, mint az Nvidia és a Runway már hasonló fejmozgás- és ajakszinkron technológiával rendelkeznek, a VASA-1 sokkal jobb minőségűnek és valósághűbbnek tűnik, ami csökkenti a szájban előforduló műtermékeket. Tom's Guide.

Ezenkívül az audiovezérelt animációnak ez a megközelítése is olyan, mint a közelmúltban Vlogger AI a Google Research modellje.

A Microsoft szerint bár a bemutató példákban szereplő összes kép Dall-E által készített szintetikus, a VASA-1 mégis képes valódi képet animálni.

A demóban különböző emberek beszélgetnek, szinte természetes mozdulatokkal, arckifejezésekkel, szemmozgással „nincs műtermék a száj tetején és alján, ami más eszközökben látható”.

A működéséhez nincs szükség arccal előre fordított portré stílusú képre sem.

A VASA-1 megszólaltatta az embereket

A mesterséges intelligencia rajongóit már most is lenyűgözi a technológia, amely „vadnak” és „őrültnek” írja le az X platformon.

"Az egyes kiadások között elért fejlesztések hihetetlenek." mondott Linus Ekenstam.

Mások azon a véleményen vannak, hogy a világ „szeizmikus változásnak van tanúja a médiatartalom létrehozásában és fogyasztásában”.

„Ez elképesztő, a realizmus elsőrangú” – mondta egy Samként azonosított rajongó.

Bár mások elismerik az eszköz képességeit, ők is kissé felelőtlenségnek tartják a Microsoft részéről egy olyan eszköz bevezetését, amely könnyen manipulálható választási mélyhamisítványok.

"Merészség ezt közvetlenül a választások előtt ejteni" írt Rowan Cheung X platformon.

Egy másik felhasználó Evan Kirstel szigorú figyelmeztetéssel kommentálta: "A Microsoft Research VASA-1 egy játékmódosító, amely hiperrealisztikus, mesterséges intelligencia által generált videókat hoz létre csupán egy fényképből és hangból."

„A lehetőségek végtelenek, a klasszikus mozilegendák felelevenítésétől a személyre szabott médiáig. De legyünk éberek a hamisított kockázatokra.”

A világ már most is látott választási hamisítványok beáramlását, ahol a politikusok hangját vagy képeit mesterséges intelligencia segítségével manipulálták propaganda terjesztésére. A világ népességének körülbelül egyharmada járul szavazni idén.

A Microsoft kutatói azonban jelezték, hogy ez csak demonstrációra szolgál, és jelenleg nem tervezik nyilvános kiadását vagy elérhetővé tételét a fejlesztők számára.

Hogyan működik a VASA-1?

A Tom's Guide szerint maguk a kutatók is meglepődtek a modell azon képességén, hogy „tökéletesen szinkronizálni tud egy dallal, gond nélkül tükrözve az énekes szavait annak ellenére, hogy a képzési adatkészletben nem használtak zenét”.

Ezenkívül a VASA-1 különféle képstílusokat kezelt, beleértve a történelmi portrékat, mint például a híres Mona Lisa.

Az eszközt a fejlett ajakszinkronizálási képességei révén játékban is használhatjuk. A szakértők szerint ez megváltoztathatja az elmélyülést.

Ezenkívül a technológia fontos szerepet játszhat a közösségi médiás videók avatárjainak létrehozásában, mint például a Synthesia és a HeyGen esetében.

A mesterséges intelligencia alapú filmek és zenei videó produkciók is felhasználhatják a VASA-1 technológiát a valósághűbb videók érdekében.

Ha a Microsoftnak részesedése van az OpenAI-ban, a VASA-1 egy „jövő másodpilóta” része lehet. Sora integráció."

Időbélyeg:

Még több MetaNews