Ahogy a mesterséges intelligencia fölényéért folytatott verseny folytatódik, a Microsoft legújabb eszközével, a VASA-1-gyel szeretné az emberek portréképeit beszélő arcokká vagy videókká alakítani.
A technológiai óriás kutatási tanulmánya szerint a Microsoft egy újabb szintre emeli az AI-versenyt, azzal VASA 1, keretrendszer vizuális affektív képességekkel (VAS) rendelkező virtuális karakterek élethű beszélő arcainak létrehozásához, mindezt portréból.
Lásd még: A videojáték-ipar rohanás az AI feletti egyesülés felé
A portréktól a beszélő arcokig
Bár még nem elérhető a nyilvánosság számára, az eszköz egyetlen portréfotót és beszédhangot készít, és hiperrealisztikus beszélő arcvideót készít precíz ajak-audio szinkronnal, élethű arcviselkedéssel és valós időben generált naturalisztikus fejmozdulatokkal.
Az eszköz még mindig a kutatás előnézeti szakaszában van a Microsoft Research csapatával, és a bemutató videók „lenyűgözőnek tűnnek”.
Míg az olyan cégek, mint az Nvidia és a Runway már hasonló fejmozgás- és ajakszinkron technológiával rendelkeznek, a VASA-1 sokkal jobb minőségűnek és valósághűbbnek tűnik, ami csökkenti a szájban előforduló műtermékeket. Tom's Guide.
Ezenkívül az audiovezérelt animációnak ez a megközelítése is olyan, mint a közelmúltban Vlogger AI a Google Research modellje.
A Microsoft szerint bár a bemutató példákban szereplő összes kép Dall-E által készített szintetikus, a VASA-1 mégis képes valódi képet animálni.
A demóban különböző emberek beszélgetnek, szinte természetes mozdulatokkal, arckifejezésekkel, szemmozgással „nincs műtermék a száj tetején és alján, ami más eszközökben látható”.
A működéséhez nincs szükség arccal előre fordított portré stílusú képre sem.
A Microsoft most mutatta be a VASA-1-et.
Ez egy új mesterséges intelligencia modell, amely 1 fényképet és 1 hanganyagot képes teljesen élethű emberi mélyhamisítássá varázsolni.
Vad, hogy ezt közvetlenül a választások előtt dobja le 😬pic.twitter.com/MuLkZVOKRM
— Rowan Cheung (@rowancheung) April 18, 2024
A VASA-1 megszólaltatta az embereket
A mesterséges intelligencia rajongóit már most is lenyűgözi a technológia, amely „vadnak” és „őrültnek” írja le az X platformon.
"Az egyes kiadások között elért fejlesztések hihetetlenek." mondott Linus Ekenstam.
Mások azon a véleményen vannak, hogy a világ „szeizmikus változásnak van tanúja a médiatartalom létrehozásában és fogyasztásában”.
„Ez elképesztő, a realizmus elsőrangú” – mondta egy Samként azonosított rajongó.
Bár mások elismerik az eszköz képességeit, ők is kissé felelőtlenségnek tartják a Microsoft részéről egy olyan eszköz bevezetését, amely könnyen manipulálható választási mélyhamisítványok.
"Merészség ezt közvetlenül a választások előtt ejteni" írt Rowan Cheung X platformon.
Egy másik felhasználó Evan Kirstel szigorú figyelmeztetéssel kommentálta: "A Microsoft Research VASA-1 egy játékmódosító, amely hiperrealisztikus, mesterséges intelligencia által generált videókat hoz létre csupán egy fényképből és hangból."
„A lehetőségek végtelenek, a klasszikus mozilegendák felelevenítésétől a személyre szabott médiáig. De legyünk éberek a hamisított kockázatokra.”
A világ már most is látott választási hamisítványok beáramlását, ahol a politikusok hangját vagy képeit mesterséges intelligencia segítségével manipulálták propaganda terjesztésére. A világ népességének körülbelül egyharmada járul szavazni idén.
A Microsoft kutatói azonban jelezték, hogy ez csak demonstrációra szolgál, és jelenleg nem tervezik nyilvános kiadását vagy elérhetővé tételét a fejlesztők számára.
Hogyan működik a VASA-1?
A Tom's Guide szerint maguk a kutatók is meglepődtek a modell azon képességén, hogy „tökéletesen szinkronizálni tud egy dallal, gond nélkül tükrözve az énekes szavait annak ellenére, hogy a képzési adatkészletben nem használtak zenét”.
Ezenkívül a VASA-1 különféle képstílusokat kezelt, beleértve a történelmi portrékat, mint például a híres Mona Lisa.
Az eszközt a fejlett ajakszinkronizálási képességei révén játékban is használhatjuk. A szakértők szerint ez megváltoztathatja az elmélyülést.
Ezenkívül a technológia fontos szerepet játszhat a közösségi médiás videók avatárjainak létrehozásában, mint például a Synthesia és a HeyGen esetében.
A mesterséges intelligencia alapú filmek és zenei videó produkciók is felhasználhatják a VASA-1 technológiát a valósághűbb videók érdekében.
Ha a Microsoftnak részesedése van az OpenAI-ban, a VASA-1 egy „jövő másodpilóta” része lehet. Sora integráció."
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- Forrás: https://metanews.com/enthusiasts-smitten-by-image-to-video-tool-vasa-1/
- :van
- :is
- :nem
- :ahol
- 1
- 10
- 7
- 8
- a
- képességek
- képesség
- Rólunk
- Szerint
- fejlett
- AI
- Éber
- Minden termék
- majdnem
- már
- Is
- an
- és a
- lelkesít
- animáció
- Másik
- megközelítés
- VANNAK
- körül
- AS
- At
- hang-
- elérhető
- karakterekkel
- vissza
- BE
- óta
- előtt
- viselkedés
- hogy
- között
- Bit
- Fúj
- Alsó
- de
- by
- TUD
- eset
- esély
- Changer
- karakter
- cheung
- mozi
- klasszikus
- kommentálta
- Companies
- fogyasztott
- tartalom
- tovább
- tudott
- készítette
- létrehozása
- Jelenleg
- dall's
- deepfakes
- demó
- demonstráció
- leíró
- Ellenére
- fejlesztők
- különböző
- nem
- hajtott
- Csepp
- minden
- könnyen
- Választás
- Végtelen
- rajongó
- rajongók
- példák
- szakértők
- kifejezések
- szem
- Arc
- arcok
- arc
- híres
- cégek
- A
- Keretrendszer
- ból ből
- teljesen
- játék
- játék-váltó
- szerencsejáték
- generált
- szerzés
- óriás
- Globális
- megy
- kapott
- útmutató
- Legyen
- tekintettel
- fej
- <p></p>
- történeti
- Hogyan
- HTTPS
- emberi
- Hiperrealisztikus
- azonosított
- kép
- képek
- elmerülés
- hatásos
- fejlesztések
- in
- Más
- Beleértve
- hihetetlen
- jelzett
- ipar
- beáramlás
- hangszeres
- integráció
- bele
- bevezet
- Bevezetett
- kérdés
- IT
- ITS
- jpeg
- éppen
- legutolsó
- Legends
- szint
- Tőkeáttétel
- élethű
- mint
- Linus
- Gyártás
- manipulált
- Média
- microsoft
- bánja
- modell
- több
- száj
- mozgalom
- mozgások
- Filmek
- sok
- zene
- Természetes
- Új
- nem
- Most
- Nvidia
- of
- on
- OpenAI
- or
- Más
- Egyéb
- felett
- Papír
- rész
- Emberek (People)
- emberek
- Személyre
- kép
- képek
- darab
- tervek
- emelvény
- Plató
- Platón adatintelligencia
- PlatoData
- közvélemény-kutatások
- népesség
- portré
- portrék
- lehetőségek
- pontos
- Preview
- termel
- produkciók
- propaganda
- nyilvános
- világítás
- Futam
- Olvass
- igazi
- real-time
- realizmus
- valószerű
- új
- elismerik
- csökkenti
- tükrözve
- engedje
- szükség
- kutatás
- kutatók
- jobb
- kockázatok
- kifutópálya
- rohanás
- s
- Mondott
- Sam
- látszik
- látott
- váltás
- Műsorok
- hasonló
- énekes
- egyetlen
- készségek
- Közösség
- Közösségi média
- dal
- beszéd
- terjedése
- Színpad
- tét
- tartózkodás
- Még mindig
- stílus
- meglepődött
- szinkronizál.
- szintetikus
- tart
- bevétel
- beszéd
- csapat
- tech
- tech óriás
- Technológia
- hogy
- A
- a világ
- maguk
- Ott.
- ők
- Szerintem
- Harmadik
- ezt
- idén
- nak nek
- szerszám
- szerszámok
- felső
- Képzések
- Átalakítás
- igaz
- FORDULAT
- használt
- használó
- Felhasználók
- segítségével
- hajó
- videó
- Videók
- Megnézem
- Tényleges
- vizuális
- HANGOK
- akar
- figyelmeztetés
- Út..
- ami
- míg
- val vel
- nélkül
- tanúi
- szavak
- Munka
- világ
- X
- év
- még
- zephyrnet