Sora AI producerar iögonfallande videor direkt

Sora AI producerar iögonfallande videor direkt

Sora AI producerar iögonfallande videor direkt PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Sora, en imponerande ny generativ videomodell skapad av OpenAI, kan ta en kort textbeskrivning och förvandla den till ett minutlångt, intrikat, högupplöst filmklipp.

OpenAI, moderbolaget till ChatGPT-chatboten och stillbildsgeneratorn DALL-E, är bland de många företag som tävlar om att förbättra denna omedelbara videogenerator. Andra företag inkluderar nystartade företag som Runway och teknikjättar som Google och Meta Platforms Inc., ägare till Facebook och Instagram.

Tekniken har potential att helt ersätta mindre skickliga digitala artister samtidigt som den påskyndar erfarna filmskapares arbete.

Läs också: OpenAI:s medgrundare, Andrej Karpathy, Steps Down, Eyes Personal Ventures

Släpp Sora

OpenAI döpte sitt nya system till Sora, det japanska ordet för himmel. Teknikens utvecklingsteam, inklusive forskarna Tim Brooks och Bill Peebles, valde namnet för att det "framkallar idén om gränslös kreativ potential."

De sa också att företaget ännu inte hade släppt Sora till allmänheten eftersom det fortfarande undersökte riskerna förknippade med systemet. Snarare delar OpenAI tekniken med en utvald grupp av akademiker och andra utomstående forskare som kommer att "reda" den, en term för att beskriva sökandet efter potentiellt missbruk.

Enligt Dr. Brooks är avsikten här att ge en förhandstitt på vad som är vid horisonten så att människor kan se kapaciteten hos denna teknik och få feedback.

OpenAI Taggar videorna

OpenAI taggar redan videor som skapats av systemet med vattenstämplar för att indikera att de har genererats av artificiell intelligens (AI). Bolaget medger dock att dessa kan tas bort. De tillade att de också kan vara utmanande att identifiera.

Enligt OpenAI, de lär ut artificiell intelligens (AI) för att förstå och simulera den fysiska världen i rörelse, med målet att träna modeller som hjälper människor att lösa problem som kräver interaktion i den verkliga världen.

Dessutom ger de åtkomst till flera bildkonstnärer, designers och filmskapare för att få feedback om hur man kan utveckla modellen för att vara mest användbar för kreativa proffs.

De delar med sig av sina forskningsframsteg tidigt för att börja arbeta med och få feedback från människor utanför OpenAI och för att ge allmänheten en känsla av vilka AI-förmågor som finns i horisonten.

Utvecklar Sora

Emellertid OpenAI avböjde att avslöja antalet videor som systemet lärde sig från eller var de kom ifrån. De uppgav bara att utbildningen omfattade både allmänt tillgängliga videor och videor licensierade av upphovsrättsinnehavare.

Företaget har stämts flera gånger för att ha använt upphovsrättsskyddat innehåll. Det försöker förmodligen behålla en fördel gentemot konkurrenterna, så det avslöjar ingenting om den data som används för att träna sin teknologi.

Dessutom har modellen en djupgående förståelse av språk, vilket gör det möjligt för den att korrekt tolka uppmaningar och generera övertygande karaktärer som levande förmedlar känslor. Sora kan också orsaka flera bilder som bibehåller den visuella bilden och karaktären i en enstaka genererad video.

OpenAI delade uppmaningen att generera en video på deras X-handtag, vilket orsakade flera reaktioner från X-användare.

Modellens svagheter

Enligt OpenAI har den nuvarande modellen svagheter. Det kan behöva hjälp med att exakt simulera fysiken i en komplex scen och kan behöva hjälp med att förstå specifika fall av orsak och verkan. Till exempel kan en person bita en kaka, men efteråt kanske kakan inte har ett bitmärke.

Modellen kan också behöva förtydliga de rumsliga detaljerna i en prompt, till exempel genom att blanda ihop vänster och höger, och kan behöva hjälp med exakta beskrivningar av händelser som äger rum över tid, som att följa en specifik kamerabana.

Tidsstämpel:

Mer från MetaNews