Tee video tekoälyllä ja muutamalla sanalla: Tutustu Metan uuteen PlatoBlockchain Data Intelligence -työkaluun. Pystysuuntainen haku. Ai.

Tee video tekoälyllä ja muutamalla sanalla: Tutustu Metan uuteen työkaluun

Tekoäly luo yhä paremmin kuvan vastauksena muutamaan sanaan julkisesti saatavilla olevien tekoälykuvageneraattoreiden, kuten DALL-E 2:n ja Stable Diffusionin, avulla. Nyt Meta-tutkijat vievät tekoälyä askeleen pidemmälle: he käyttävät sitä videoiden keksimiseen tekstikehotteesta.

Metan toimitusjohtaja Mark Zuckerberg julkaisi tutkimuksesta Facebookissa torstaina, Kutsutaan Tehdä video, 20 sekunnin pätkällä, joka koonnut useita Meta-tutkijoiden käyttämiä tekstikehotteita ja tuloksena syntyneitä (erittäin lyhyitä) videoita. Kehotteita ovat muun muassa "Nalle maalaamassa omakuvaa", "Avaruusalus laskeutumassa Marsiin", "Laskiainen, jolla on neulottu hattu yrittää selvittää kannettavaa tietokonetta" ja "Robotti surffaamassa aallolla valtameressä".

Kunkin kehotteen videot ovat vain muutaman sekunnin pituisia, ja ne näyttävät yleensä sen, mitä kehote ehdottaa (lukuun ottamatta laiskiaisen vauvaa, joka ei näytä paljoakaan todelliselta olennolta), melko alhaisella resoluutiolla ja hieman nykivänä. tyyli. Siitä huolimatta se osoittaa, että tekoälytutkimus ottaa uuden suunnan, kun järjestelmät tulevat yhä paremmaksi luomaan kuvia sanoista. Jos tekniikka kuitenkin lopulta julkaistaan ​​laajalti, se herättää monia samoja huolenaiheita, joita tekstistä kuvaksi -järjestelmät herättävät, kuten sen, että sitä voidaan käyttää väärän tiedon levittämiseen videon välityksellä.

Web-sivu for Make-A-Video sisältää nämä lyhyet leikkeet ja muut, joista jotkut näyttävät melko realistisilta, kuten video, joka on luotu vastauksena kehotteeseen “Klovnikalat uimassa koralliriutan läpi” tai sellainen, jonka on tarkoitus näyttää "Nuori pari kävelee rankkasateessa"

Facebook-viestissään Zuckerberg huomautti, kuinka hankalaa on luoda liikkuva kuva kourallisista sanoista.

"On paljon vaikeampaa luoda videoita kuin valokuvia, koska kunkin pikselin oikean luomisen lisäksi järjestelmän on myös ennakoitava, kuinka ne muuttuvat ajan myötä", hän kirjoitti.

Tutkimuspaperi työn kuvauksessa selitetään, että projektissa käytetään tekstistä kuvaksi tekoälymallia selvittääkseen, miten sanat vastaavat kuvia, sekä tekoälytekniikkaa, joka tunnetaan ns. ohjaamaton oppiminen — jossa algoritmit tunkeutuvat dataan, jota ei ole merkitty tunnistettujen kuvioiden erottamiseksi — katsoakseen videoita ja määrittääkseen, miltä realistinen liike näyttää.

Kuten massiivisissa, suosituissa tekoälyjärjestelmissä, jotka luovat kuvia tekstistä, tutkijat huomauttivat, että heidän tekstistä kuvaksi AI-mallinsa on koulutettu Internet-datan perusteella, mikä tarkoittaa, että se oppi "ja todennäköisesti liioitteli sosiaalisia ennakkoluuloja, myös haitallisia", tutkijat. kirjoitti. He huomauttivat, että he suodattivat tiedot "NSFW-sisällön ja myrkyllisten sanojen" perusteella, mutta koska tietojoukot voivat sisältää miljoonia kuvia ja tekstiä, kaikkea tällaista sisältöä ei ehkä ole mahdollista poistaa.

Zuckerberg kirjoitti, että Meta aikoo jakaa Make-A-Video -projektin demona tulevaisuudessa.

The-CNN-Wire™ & © 2022 Cable News Network, Inc., Warner Bros. Discovery Company. Kaikki oikeudet pidätetään.

Aikaleima:

Lisää aiheesta WRAL Techwire