Sora AI produce istantaneamente video strabilianti

Sora AI produce istantaneamente video strabilianti

Sora AI Produces Eye-Popping Videos Instantly PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Sora, un nuovo impressionante modello video generativo creato da OpenAI, può prendere una breve descrizione testuale e trasformarla in un filmato ad alta definizione, lungo un minuto, intricato.

OpenAI, la società madre del chatbot ChatGPT e del generatore di immagini fisse DALL-E, è tra le tante aziende in lizza per migliorare questo generatore di video istantanei. Altre aziende includono start-up come Runway e giganti della tecnologia come Google e Meta Platforms Inc., i proprietari di Facebook e Instagram.

La tecnologia ha il potenziale per sostituire completamente gli artisti digitali meno qualificati, accelerando al tempo stesso il lavoro dei registi esperti.

Leggi anche: Il cofondatore di OpenAI, Andrej Karpathy, si dimette da Eyes Personal Ventures

Liberare Sora

OpenAI ha chiamato il suo nuovo sistema Sora, la parola giapponese per cielo. Il team di sviluppo della tecnologia, inclusi i ricercatori Tim Brooks e Bill Peebles, ha scelto il nome perché "evoca l'idea di un potenziale creativo illimitato".

Hanno anche detto che la società deve ancora rilasciare Sora al pubblico perché sta ancora esaminando i rischi associati al sistema. Piuttosto, OpenAI sta condividendo la tecnologia con un gruppo selezionato di accademici e altri ricercatori esterni che la metteranno in “squadra rossa”, un termine per descrivere la ricerca di potenziali usi impropri.

Secondo il dottor Brooks, l'intenzione è quella di fornire un'anteprima di ciò che si profila all'orizzonte in modo che le persone possano vedere le capacità di questa tecnologia e ottenere feedback.

OpenAI tagga i video

OpenAI tagga già i video creati dal sistema con filigrane per indicare che sono stati generati dall'intelligenza artificiale (AI). Tuttavia, la società riconosce che questi possono essere rimossi. Hanno aggiunto che possono anche essere difficili da identificare.

Secondo OpenAI, stanno insegnando all'intelligenza artificiale (AI) a comprendere e simulare il mondo fisico in movimento, con l'obiettivo di formare modelli che aiutino le persone a risolvere problemi che richiedono l'interazione nel mondo reale.

Inoltre, stanno garantendo l’accesso a diversi artisti visivi, designer e registi per ottenere feedback su come far avanzare il modello per essere più utile per i professionisti creativi.

Stanno condividendo fin dall'inizio i progressi della loro ricerca per iniziare a lavorare e ricevere feedback da persone esterne a OpenAI e per dare al pubblico un'idea di quali capacità di intelligenza artificiale sono all'orizzonte.

Sviluppare Sora

Però, i OpenAI ha rifiutato di rivelare il numero di video da cui il sistema ha appreso o da dove provenissero. Hanno solo affermato che la formazione includeva sia video disponibili al pubblico che video concessi in licenza dai detentori del copyright.

La società è stata denunciata più volte per aver utilizzato contenuti protetti da copyright. Probabilmente sta cercando di mantenere un vantaggio rispetto ai concorrenti, quindi non rivela nulla sui dati utilizzati per addestrare le sue tecnologie.

Inoltre, il modello ha una profonda comprensione del linguaggio, che gli consente di interpretare accuratamente le istruzioni e generare personaggi avvincenti che trasmettono vividamente emozioni. Sora può anche creare diverse inquadrature che mantengono l'inquadratura visiva e il carattere all'interno di un singolo video generato.

OpenAI ha condiviso la richiesta di generare un video sul proprio handle X, provocando diverse reazioni da parte degli utenti X.

I punti deboli del modello

Secondo OpenAI, il modello attuale presenta dei punti deboli. Potrebbe aver bisogno di aiuto per simulare accuratamente la fisica di una scena complessa e potrebbe aver bisogno di aiuto per comprendere istanze specifiche di causa ed effetto. Ad esempio, una persona potrebbe mordere un biscotto, ma in seguito il biscotto potrebbe non lasciare il segno del morso.

Il modello potrebbe anche aver bisogno di chiarire i dettagli spaziali di un prompt, ad esempio mescolando sinistra e destra, e potrebbe aver bisogno di aiuto con descrizioni precise di eventi che si verificano nel tempo, come seguire una specifica traiettoria della telecamera.

Timestamp:

Di più da MetaNotizie