Sora AI producerer iøjnefaldende videoer med det samme

Sora AI producerer iøjnefaldende videoer med det samme

Sora AI producerer iøjnefaldende videoer øjeblikkeligt PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Sora, en imponerende ny generativ videomodel skabt af OpenAI, kan tage en kort tekstbeskrivelse og omdanne den til et minut langt, indviklet high-definition filmklip.

OpenAI, moderselskabet for ChatGPT chatbot og still-billedgeneratoren DALL-E, er blandt de mange virksomheder, der kæmper om at forbedre denne øjeblikkelige videogenerator. Andre virksomheder omfatter start-ups som Runway og teknologigiganter som Google og Meta Platforms Inc., ejerne af Facebook og Instagram.

Teknologien har potentialet til fuldstændig at erstatte mindre dygtige digitale kunstnere og samtidig fremskynde erfarne filmskaberes arbejde.

Læs også: OpenAI's medstifter, Andrej Karpathy, Steps Down, Eyes Personal Ventures

Slip Sora

OpenAI navngav sit nye system Sora, det japanske ord for himmel. Teknologiens udviklingsteam, herunder forskerne Tim Brooks og Bill Peebles, valgte navnet, fordi det "fremkalder ideen om ubegrænset kreativt potentiale."

De sagde også, at virksomheden endnu ikke havde frigivet Sora til offentligheden, fordi den stadig undersøgte de risici, der er forbundet med systemet. Tværtimod deler OpenAI teknologien med en udvalgt gruppe af akademikere og andre eksterne forskere, som vil "red team" den, et udtryk til at beskrive søgning efter potentielle misbrug.

Ifølge Dr. Brooks er hensigten her at give en forsmag på, hvad der er i horisonten, så folk kan se denne teknologis muligheder og få feedback.

OpenAI mærker videoerne

OpenAI mærker allerede videoer oprettet af systemet med vandmærker for at angive, at de er genereret af kunstig intelligens (AI). Selskabet erkender dog, at disse kan fjernes. De tilføjede, at de også kan være udfordrende at identificere.

Ifølge OpenAI, underviser de i kunstig intelligens (AI) til at forstå og simulere den fysiske verden i bevægelse, med det formål at træne modeller, der hjælper mennesker med at løse problemer, der kræver interaktion i den virkelige verden.

Derudover giver de adgang til adskillige billedkunstnere, designere og filmskabere for at få feedback om, hvordan man kan fremme modellen til at være mest nyttig for kreative fagfolk.

De deler deres forskningsfremskridt tidligt for at begynde at arbejde med og få feedback fra folk uden for OpenAI og for at give offentligheden en fornemmelse af, hvilke AI-kapaciteter der er i horisonten.

Udvikling af Sora

Imidlertid OpenAI afviste at oplyse antallet af videoer, systemet lærte af, eller hvor de kom fra. De oplyste kun, at uddannelsen omfattede både offentligt tilgængelige videoer og videoer, der er licenseret af copyright-indehavere.

Virksomheden er flere gange blevet sagsøgt for at bruge ophavsretligt beskyttet indhold. Det forsøger sandsynligvis at bevare en fordel i forhold til konkurrenterne, så det afslører ikke noget om de data, der bruges til at træne sine teknologier.

Desuden har modellen en dyb forståelse af sproget, hvilket gør den i stand til præcist at fortolke prompter og generere overbevisende karakterer, der levende formidler følelser. Sora kan også forårsage flere optagelser, der fastholder det visuelle billede og karakter i en enkelt-genereret video.

OpenAI delte prompten om at generere en video på deres X-håndtag, hvilket forårsagede adskillige reaktioner fra X-brugere.

Modellens svagheder

Ifølge OpenAI har den nuværende model svagheder. Det kan have brug for hjælp til nøjagtigt at simulere fysikken i en kompleks scene og kan have brug for hjælp til at forstå specifikke tilfælde af årsag og virkning. For eksempel kan en person bide en småkage, men bagefter har kagen muligvis ikke et bidemærke.

Modellen skal muligvis også afklare de rumlige detaljer i en prompt, for eksempel ved at blande venstre og højre, og kan have brug for hjælp til præcise beskrivelser af begivenheder, der finder sted over tid, som at følge en specifik kamerabane.

Tidsstempel:

Mere fra MetaNews