Tehke video AI ja mõne sõnaga: vaadake Meta uut tööriista PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Tee video AI ja mõne sõnaga: vaadake Meta uut tööriista

Tehisintellekt hakkab järjest paremini looma pildi vastuseks käputäiele sõnadele avalikult kättesaadavate tehisintellekti kujutiste generaatoritega, nagu DALL-E 2 ja Stable Diffusion. Nüüd astuvad Meta teadlased tehisintellektiga sammu edasi: nad kasutavad seda tekstiviipast videote loomiseks.

Meta tegevjuht Mark Zuckerberg postitas neljapäeval Facebooki uuringu kohtaEhk Tee-A-Video, 20-sekundilise klipiga, mis koostas mitu Meta teadlaste kasutatud tekstiviipa ja sellest tulenevad (väga lühikesed) videod. Viipade hulka kuuluvad "Autoportreed maaliv kaisukaru", "Marsile maanduv kosmoselaev", "Kootud mütsiga laiskloom, kes püüab sülearvutit välja mõelda" ja "Robot ookeanil lainel surfamas".

Iga viipa videod on vaid mõne sekundi pikkused ja üldiselt näidatakse seda, mida viip soovitab (välja arvatud laiskupoeg, kes ei näe väga välja nagu tegelik olend), üsna madala eraldusvõimega ja pisut tõmbleva stiilis. Sellegipoolest näitab see uut suunda, mida AI-uuringud võtavad, kuna süsteemid muutuvad sõnadest piltide loomisel üha paremaks. Kui tehnoloogia lõpuks siiski laialdaselt avaldatakse, tekitab see palju samu probleeme, mida tekitavad teksti-pildiks süsteemid, näiteks võib seda kasutada video kaudu valeinformatsiooni levitamiseks.

Veebileht for Make-A-Video sisaldab neid lühikesi klippe ja teisi, millest mõned näevad üsna realistlikud välja, näiteks video, mis on loodud vastuseks viipale “Klounkalad ujuvad läbi korallrifi” või selline, mis on mõeldud näitamiseks “Noorpaar kõnnib tugevas vihmasajus. "

Zuckerberg tõi oma Facebooki postituses välja, kui keeruline on käputäiest sõnadest liikuvat pilti genereerida.

"Videot on palju raskem luua kui fotosid, sest peale iga piksli õige genereerimise peab süsteem ennustama ka seda, kuidas need aja jooksul muutuvad," kirjutas ta.

Uurimistöö töö kirjeldamisel selgitatakse, et projekt kasutab tekstist pildiks tehisintellekti mudelit, et välja selgitada, kuidas sõnad vastavad piltidele, ja tehisintellekti tehnikat, mida tuntakse järelevalveta õppimine — mille puhul algoritmid liiguvad üle andmetele, mis pole sildistatud, et eristada selles mustreid — vaadata videoid ja teha kindlaks, milline näeb välja realistlik liikumine.

Nagu massiivsete populaarsete tehisintellektisüsteemide puhul, mis loovad tekstist pilte, juhtisid teadlased tähelepanu sellele, et nende tekstist pildiks muutmise tehisintellekti mudelit kasutati Interneti-andmete põhjal, mis tähendab, et see õppis "ja tõenäoliselt liialdas sotsiaalseid eelarvamusi, sealhulgas kahjulikke". kirjutas. Nad märkisid, et nad filtreerisid andmeid "NSFW-sisu ja mürgiste sõnade jaoks", kuid kuna andmekogumid võivad sisaldada miljoneid pilte ja teksti, ei pruugi kogu sellist sisu olla võimalik eemaldada.

Zuckerberg kirjutas, et Meta plaanib tulevikus Make-A-Video projekti demona jagada.

The-CNN-Wire™ & © 2022 Cable News Network, Inc., Warner Bros. Discovery Company. Kõik õigused kaitstud.

Ajatempel:

Veel alates WRAL Techwire