Sora AI produserer iøynefallende videoer umiddelbart

Sora AI produserer iøynefallende videoer umiddelbart

Sora AI produserer iøynefallende videoer umiddelbart PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Sora, en imponerende ny generativ videomodell laget av OpenAI, kan ta en kort tekstbeskrivelse og forvandle den til et minuttlangt, intrikat HD-filmklipp.

OpenAI, morselskapet til ChatGPT chatbot og stillbildegeneratoren DALL-E, er blant de mange selskapene som kjemper om å forbedre denne øyeblikkelige videogeneratoren. Andre selskaper inkluderer start-ups som Runway og teknologigiganter som Google og Meta Platforms Inc., eierne av Facebook og Instagram.

Teknologien har potensialet til å erstatte mindre dyktige digitale artister, samtidig som det øker hastigheten på arbeidet til erfarne filmskapere.

Les også: OpenAIs medgründer, Andrej Karpathy, Steps Down, Eyes Personal Ventures

Slipper Sora

OpenAI kalte sitt nye system Sora, det japanske ordet for himmel. Teknologiens utviklingsteam, inkludert forskerne Tim Brooks og Bill Peebles, valgte navnet fordi det "fremkaller ideen om ubegrenset kreativt potensial."

De sa også at selskapet ennå ikke hadde frigitt Sora til offentligheten fordi det fortsatt undersøkte risikoene forbundet med systemet. Snarere deler OpenAI teknologien med en utvalgt gruppe akademikere og andre eksterne forskere som vil "red team" den, et begrep for å beskrive leting etter potensielt misbruk.

Ifølge Dr. Brooks er intensjonen her å gi en forhåndsvisning av hva som er i horisonten slik at folk kan se mulighetene til denne teknologien og få tilbakemeldinger.

OpenAI merker videoene

OpenAI merker allerede videoer laget av systemet med vannmerker for å indikere at de ble generert av kunstig intelligens (AI). Selskapet erkjenner imidlertid at disse kan fjernes. De la til at de også kan være utfordrende å identifisere.

Ifølge OpenAI, lærer de kunstig intelligens (AI) for å forstå og simulere den fysiske verden i bevegelse, med målet om å trene modeller som hjelper folk å løse problemer som krever interaksjon i den virkelige verden.

I tillegg gir de tilgang til flere billedkunstnere, designere og filmskapere for å få tilbakemelding på hvordan man kan fremme modellen for å være mest nyttig for kreative fagfolk.

De deler forskningen sin tidlig for å begynne å jobbe med og få tilbakemeldinger fra folk utenfor OpenAI og for å gi publikum en følelse av hvilke AI-evner som er i horisonten.

Utvikler Sora

Imidlertid OpenAI nektet å avsløre antall videoer systemet lærte fra eller hvor de kom fra. De opplyste bare at opplæringen inkluderte både offentlig tilgjengelige videoer og videoer lisensiert av rettighetshavere.

Selskapet har blitt saksøkt flere ganger for bruk av opphavsrettsbeskyttet innhold. Den prøver sannsynligvis å beholde en fordel i forhold til konkurrenter, så den avslører ikke noe om dataene som brukes til å trene teknologiene.

Videre har modellen en dyp forståelse av språket, som gjør den i stand til å tolke spørsmål nøyaktig og generere overbevisende karakterer som levende formidler følelser. Sora kan også forårsake flere bilder som opprettholder det visuelle bildet og karakteren i en enkeltgenerert video.

OpenAI delte oppfordringen om å generere en video på X-håndtaket, noe som forårsaket flere reaksjoner fra X-brukere.

Modellens svakheter

Ifølge OpenAI har den nåværende modellen svakheter. Det kan trenge hjelp med nøyaktig simulering av fysikken til en kompleks scene og kan trenge hjelp til å forstå spesifikke tilfeller av årsak og virkning. For eksempel kan en person bite en informasjonskapsel, men etterpå kan det hende at informasjonskapselen ikke har et bitemerke.

Modellen kan også trenge å klargjøre de romlige detaljene til en forespørsel, for eksempel å blande venstre og høyre, og kan trenge hjelp med presise beskrivelser av hendelser som finner sted over tid, som å følge en spesifikk kamerabane.

Tidstempel:

Mer fra MetaNews