A Meta bemutatja az Audio2PhotoRealt a metaverse interakciókhoz

A Meta bemutatja az Audio2PhotoRealt a metaverse interakciókhoz

A Meta egy másik AI-koncepciót vezetett be a metaverzum iparágába. Allen T., egy mesterséges intelligencia oktató és fejlesztő legutóbbi tweetje szerint a cég kiadott egy új keretrendszert Audio2Photoreal néven.

Audio2Photoreal egy keretrendszer testes, fotorealisztikus avatarok generálására, amelyeket természetesen a szerző hangja vezérel. Ezek az avatarok életre kelnek a beszédhangon keresztül, amely integrálódik az emberek gesztusos mozgásába.

Az egyénektől származó nyers hangbeszéd alapján egy modell jön létre a megfelelő fotorealisztikus gesztusok generálására. A rendszer két generatív modellből áll, amelyek az avatar kifejezési kódjait és testpózait reprezentálják.

Az Allen T által feltöltött klipek szerint az egyén különböző részeit, beleértve a szájat, a kezet és az arcot, érinti ez a kiegészítés.

A kiadott demók némelyike ​​több generált minta, két személyes beszélgetés, női avatarok mintája, valamint a diffúziós modellt vezérlő útmutató pózok. Allen T. hozzátette, hogy a metaverzum szórakoztató lesz ezzel a fejlesztéssel. Máshol a technológiai közösség izgatottnak tűnik a bejegyzéshez fűzött megjegyzések nyomán. Egy felhasználó @EverettWorld Twitteren, "Ha a Metaverse így néz ki, akkor benne vagyok!"

Egy másik felhasználó azonban izgatott, hogy már nem nagyon bízik Metában. Az @AIandDesign szerint A meta ártalmas az emberre követve az egész Cambridge Analytica dolgot. A felhasználó hozzáteszi,

„Ez az egész olyan klassz. Bárcsak ne Meta lenne. már nem nagyon bízom bennük. Az egész Cambridge Analytica után teljesen készen vagyok Metával. Károsak az emberiségre. Szó szerint. FB-on vagyok, de csak családi dolgok miatt."

Az Audio2Photoreal koncepció mögötti technológia

arXiv, egy kurált kutatás-megosztó platform, amely nyitva áll a tudósok számára, hogy megosszák a kutatásaikat, mielőtt azokat szakértői értékelés alá vonták. Audio2Photoreal.

Az avatar testmozgását hangra vagy szövegre kondicionált diffúziós modell segítségével szintetizálják. Az arcmozgáshoz egy hangkondicionált diffúziós modellt állítottunk össze az audiobemenetből.

A test és az arc azonban erősen eltérő dinamikát követ, ahol az arc erősen korrelál a bemeneti hanggal, míg a test gyengébb a beszéddel.

A Meta Audio2Photoreal most lehetővé teszi a hangalapú fotorealisztikus avatarokat

A Meta Audio2Photoreal most lehetővé teszi a hangalapú fotorealisztikus avatarokat

Az Audio2Photoreal jelentősége a metaverzumban 

A Meta részvétele a Metaverzumban az ökoszisztéma valósághűbbé tételét célozza. Ezek az Audio2Photoreal avatarok hang segítségével tükrözhetik az egyén arckifejezését és testmozdulatait.

Hasonló kapcsolatot hoz létre, mint amikor az egyének négyszemközt beszélgetnek. A személynek olyan egyedi fizikai tulajdonságai lesznek, mint a magasság, a bőr- és hajszín, a test alakja és más pontos tulajdonságok. Dolgozik a Metaverzum ökoszisztéma rugalmasabbá válik, mivel nincs szükség webkamerára, videóra vagy minőségi okostelefon-kamerára.

A Facebook, az X és az Instagram bepereli Ohiót, hogy hagyják abba a közösségi média törvényét

Egy másik közelmúltbeli fejlesztésben a NetChoice, egy olyan közösségi média platformokat képviselő cég, mint a Facebook, az Instagram és az X, benyújtott egy kérelmet. per az ohiói új közösségi médiatörvény ellen január 5-én.

A cég 34 oldalas keresetet indított az ohiói közösségi média szülői értesítési törvényének blokkolására, amely január 15-én lépett volna hatályba, de csak az említett dátum után létrehozott fiókokon.

A közösségi médiáról szóló törvény ragaszkodik ahhoz, hogy a platformoknak meg kell szerezniük a szülők beleegyezését a 16 évnél fiatalabb felhasználók számára. A kereset azonban kijelenti, hogy a törvény „jelentős akadályt állítana egyes kiskorúak azon képessége elé, hogy beszédet folytassanak ezeken a weboldalakon”.

Időbélyeg:

Még több MetaNews