Tehke tehisintellekti ja mõne sõnaga video: vaadake Meta uut tööriista

Taasavaldanud Platon

järgijaid: 0

Rachel Metz, CNN Business

Tehisintellekt hakkab järjest paremini looma pildi vastuseks käputäiele sõnadele avalikult kättesaadavate tehisintellekti kujutiste generaatoritega, nagu DALL-E 2 ja Stable Diffusion. Nüüd astuvad Meta teadlased tehisintellektiga sammu edasi: nad kasutavad seda tekstiviipast videote loomiseks.

Meta tegevjuht Mark Zuckerberg postitas neljapäeval Facebooki uuringu kohtaEhk Tee-A-Video, 20-sekundilise klipiga, mis koostas mitu Meta teadlaste kasutatud tekstiviipa ja sellest tulenevad (väga lühikesed) videod. Viipade hulka kuuluvad "Autoportreed maaliv kaisukaru", "Marsile maanduv kosmoselaev", "Kootud mütsiga laiskloom, kes püüab sülearvutit välja mõelda" ja "Robot ookeanil lainel surfamas".

Iga viipa videod on vaid mõne sekundi pikkused ja üldiselt näidatakse seda, mida viip soovitab (välja arvatud laiskupoeg, kes ei näe väga välja nagu tegelik olend), üsna madala eraldusvõimega ja pisut tõmbleva stiilis. Sellegipoolest näitab see uut suunda, mida AI-uuringud võtavad, kuna süsteemid muutuvad sõnadest piltide loomisel üha paremaks. Kui tehnoloogia lõpuks siiski laialdaselt avaldatakse, tekitab see palju samu probleeme, mida tekitavad teksti-pildiks süsteemid, näiteks võib seda kasutada video kaudu valeinformatsiooni levitamiseks.

Veebileht for Make-A-Video sisaldab neid lühikesi klippe ja teisi, millest mõned näevad üsna realistlikud välja, näiteks video, mis on loodud vastuseks viipale “Klounkalad ujuvad läbi korallrifi” või selline, mis on mõeldud näitamiseks “Noorpaar kõnnib tugevas vihmasajus. "

Zuckerberg tõi oma Facebooki postituses välja, kui keeruline on käputäiest sõnadest liikuvat pilti genereerida.

"Videot on palju raskem luua kui fotosid, sest peale iga piksli õige genereerimise peab süsteem ennustama ka seda, kuidas need aja jooksul muutuvad," kirjutas ta.

Uurimistöö töö kirjeldamisel selgitatakse, et projekt kasutab tekstist pildiks tehisintellekti mudelit, et välja selgitada, kuidas sõnad vastavad piltidele, ja tehisintellekti tehnikat, mida tuntakse järelevalveta õppimine — mille puhul algoritmid liiguvad üle andmetele, mis pole sildistatud, et eristada selles mustreid — vaadata videoid ja teha kindlaks, milline näeb välja realistlik liikumine.

Nagu massiivsete populaarsete tehisintellektisüsteemide puhul, mis loovad tekstist pilte, juhtisid teadlased tähelepanu sellele, et nende tekstist pildiks muutmise tehisintellekti mudelit kasutati Interneti-andmete põhjal, mis tähendab, et see õppis "ja tõenäoliselt liialdas sotsiaalseid eelarvamusi, sealhulgas kahjulikke". kirjutas. Nad märkisid, et nad filtreerisid andmeid "NSFW-sisu ja mürgiste sõnade jaoks", kuid kuna andmekogumid võivad sisaldada miljoneid pilte ja teksti, ei pruugi kogu sellist sisu olla võimalik eemaldada.

Zuckerberg kirjutas, et Meta plaanib tulevikus Make-A-Video projekti demona jagada.

Ajatempel: September 30, 2022September 30, 2022

Ajatempel: September 21, 2022

Taasavaldanud Platon

Fed võib eluasemeturu kokku kukkuda

Cary õhu püüdmise startup Sustaera nimetab uueks tegevjuhiks gaasitöötlemisjuhi

Epic äratab arhitektuuri-, inseneri- ja ehitusturud ellu ümbritsevate tööriistadega

Tuluaruanded: Bioventus, Humacyte, Guerrilla RF, Novan, Liquidia ja palju muud

Rocky Mountis laienev ehitustoodete ettevõte Woodgrain palkab rohkem töötajaid

FTC vaatab "teise" pilguga Amazoni plaanidele osta iRobot, One Medical

Apple pakub ülimat turbetaset – selle lubamiseks toimige järgmiselt

Rohkem koondamisi: Wayfair vähendab 5% oma ülemaailmsest tööjõust

A-st Z-ni nimetab NC TECH iga-aastaste auhindade finaliste

Google Fiber, millel on kasvav NC katvus, laienedes veel viide osariiki

Apple'i uusima tehnoloogia kasutamine: vaadake või kuulake MacRumorsi siseringi nõuandeid

Rikkad saavad rikkamaks: USA lisab 2.5 miljonit miljonäri; praegu üle 62.5 miljoni üle maailma

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto