Realizza un video con l'intelligenza artificiale e poche parole: dai un'occhiata al nuovo strumento di Meta, PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Crea un video con AI e poche parole: dai un'occhiata al nuovo strumento di Meta

L’intelligenza artificiale sta migliorando sempre di più nel generare un’immagine in risposta a una manciata di parole, con generatori di immagini AI disponibili al pubblico come DALL-E 2 e Stable Diffusion. Ora, i ricercatori di Meta stanno portando l’intelligenza artificiale un ulteriore passo avanti: la stanno usando per creare video da un messaggio di testo.

Mark Zuckerberg, CEO di Meta pubblicato su Facebook giovedì in merito alla ricerca, chiamato Fare un video, con una clip di 20 secondi che raccoglieva diversi suggerimenti di testo utilizzati dai ricercatori di Meta e i video (molto brevi) risultanti. Le istruzioni includono "Un orsacchiotto che dipinge un autoritratto", "Un'astronave che atterra su Marte", "Un piccolo bradipo con un cappello lavorato a maglia che cerca di capire un laptop" e "Un robot che surfa su un'onda nell'oceano".

I video per ciascun messaggio durano solo pochi secondi e generalmente mostrano ciò che suggerisce il messaggio (ad eccezione del cucciolo di bradipo, che non assomiglia molto alla creatura reale), in una risoluzione abbastanza bassa e un po' a scatti. stile. Anche così, dimostra una nuova direzione che la ricerca sull’intelligenza artificiale sta prendendo man mano che i sistemi diventano sempre più bravi nel generare immagini dalle parole. Se alla fine la tecnologia verrà diffusa su larga scala, tuttavia, solleverà molte delle stesse preoccupazioni suscitate dai sistemi text-to-image, ad esempio il fatto che potrebbe essere utilizzata per diffondere disinformazione tramite video.

Una pagina web per Make-A-Video include questi brevi clip e altri, alcuni dei quali sembrano abbastanza realistici, come un video creato in risposta alla richiesta “Pesci pagliaccio che nuotano nella barriera corallina” o uno destinato a mostrare “Una giovane coppia che cammina sotto una forte pioggia. "

Nel suo post su Facebook, Zuckerberg ha sottolineato quanto sia complicato generare un'immagine in movimento da una manciata di parole.

"È molto più difficile generare video che foto perché oltre a generare correttamente ciascun pixel, il sistema deve anche prevedere come cambieranno nel tempo", ha scritto.

Un documento di ricerca descrivendo il lavoro spiega che il progetto utilizza un modello di intelligenza artificiale testo-immagine per capire come le parole corrispondono alle immagini e una tecnica di intelligenza artificiale nota come apprendimento senza supervisione - in cui gli algoritmi esaminano attentamente i dati che non sono etichettati per discernere i modelli al loro interno - per guardare video e determinare quale sia il movimento realistico.

Come con i massicci e popolari sistemi di intelligenza artificiale che generano immagini dal testo, i ricercatori hanno sottolineato che il loro modello di intelligenza artificiale da testo a immagine è stato addestrato sui dati di Internet, il che significa che ha appreso “e probabilmente ha esagerato i pregiudizi sociali, compresi quelli dannosi”. ha scritto. Hanno notato di aver filtrato i dati per “contenuti NSFW e parole tossiche”, ma poiché i set di dati possono includere molti milioni di immagini e testo, potrebbe non essere possibile rimuovere tutti questi contenuti.

Zuckerberg ha scritto che Meta intende condividere il progetto Make-A-Video come demo in futuro.

The-CNN-Wire™ & © 2022 Cable News Network, Inc., una Warner Bros. Discovery Company. Tutti i diritti riservati.

Timestamp:

Di più da WRAL Techwire