Sora AI ustvari osupljive videoposnetke v trenutku

Sora AI ustvari osupljive videoposnetke v trenutku

Sora AI v trenutku ustvari osupljive videoposnetke PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Sora, impresiven nov generativni video model, ki ga je ustvaril OpenAI, lahko vzame kratek besedilni opis in ga pretvori v minuto dolg, zapleten filmski posnetek visoke ločljivosti.

OpenAI, matična družba klepetalnega robota ChatGPT in generatorja mirujočih slik DALL-E, je med številnimi podjetji, ki tekmujejo za izboljšanje tega takojšnjega generatorja videa. Druga podjetja vključujejo start-upe, kot je Runway, in tehnološke velikane, kot sta Google in Meta Platforms Inc., lastnika Facebooka in Instagrama.

Tehnologija ima potencial, da popolnoma nadomesti manj usposobljene digitalne umetnike, hkrati pa pospeši delo izkušenih filmskih ustvarjalcev.

Preberite tudi: Soustanovitelj OpenAI, Andrej Karpathy, Steps Down, Eyes Personal Ventures

Izpuščanje Sore

OpenAI je svoj novi sistem poimenoval Sora, japonska beseda za nebo. Ekipa za razvoj tehnologije, vključno z raziskovalcema Timom Brooksom in Billom Peeblesom, je izbrala ime, ker »vzbuja zamisel o neomejenem ustvarjalnem potencialu«.

Rekli so tudi, da družba še ni objavila Sore javnosti, ker še preučuje tveganja, povezana s sistemom. Namesto tega OpenAI deli tehnologijo z izbrano skupino akademikov in drugih zunanjih raziskovalcev, ki jo bodo "rdeče združili", kar je izraz za opis iskanja potencialnih zlorab.

Po besedah ​​dr. Brooksa je namen tukaj dati predogled tega, kar je na obzorju, tako da lahko ljudje vidijo zmogljivosti te tehnologije in dobijo povratne informacije.

OpenAI označi videoposnetke

OpenAI že označuje videoposnetke, ki jih je ustvaril sistem, z vodnimi žigi, ki označujejo, da jih je ustvarila umetna inteligenca (AI). Vendar podjetje priznava, da jih je mogoče odstraniti. Dodali so, da jih je lahko tudi težko prepoznati.

Glede na OpenAI, umetno inteligenco (AI) učijo razumeti in simulirati fizični svet v gibanju, s ciljem usposabljanja modelov, ki ljudem pomagajo pri reševanju problemov, ki zahtevajo interakcijo v resničnem svetu.

Poleg tega omogočajo dostop do več vizualnih umetnikov, oblikovalcev in filmskih ustvarjalcev, da pridobijo povratne informacije o tem, kako izboljšati model, da bo kar najbolj koristen za ustvarjalne strokovnjake.

Svoj napredek pri raziskavah delijo zgodaj, da bi začeli sodelovati z ljudmi zunaj OpenAI in pridobiti povratne informacije od njih ter javnosti dati občutek, kakšne zmogljivosti umetne inteligence so na obzorju.

Razvija Sora

Vendar pa OpenAI ni želel razkriti števila videoposnetkov, iz katerih se je sistem naučil, ali od kod prihajajo. Navedli so le, da je usposabljanje vključevalo tako javno dostopne videe kot video posnetke z licenco imetnikov avtorskih pravic.

Podjetje je bilo večkrat toženo zaradi uporabe avtorsko zaščitenih vsebin. Verjetno poskuša ohraniti prednost pred tekmeci, zato ne razkriva ničesar o podatkih, ki jih uporablja za usposabljanje svojih tehnologij.

Poleg tega ima model globoko razumevanje jezika, kar mu omogoča natančno interpretacijo pozivov in ustvarjanje prepričljivih znakov, ki živo izražajo čustva. Sora lahko povzroči tudi več posnetkov, ki ohranjajo vizualni posnetek in značaj v enem samem ustvarjenem videu.

OpenAI je delil poziv za ustvarjanje videoposnetka na svojem X ročaju, kar je povzročilo številne reakcije uporabnikov X.

Slabosti modela

Glede na OpenAI ima trenutni model slabosti. Morda potrebuje pomoč pri natančni simulaciji fizike kompleksnega prizora in morda potrebuje pomoč pri razumevanju določenih primerov vzroka in posledice. Oseba lahko na primer ugrizne piškotek, potem pa na piškotku morda ne bo sledi ugriza.

Model bo morda moral razjasniti tudi prostorske podrobnosti poziva, na primer mešanje leve in desne strani, in morda bo potreboval pomoč pri natančnih opisih dogodkov, ki se odvijajo skozi čas, kot je sledenje določeni poti kamere.

Časovni žig:

Več od MetaNovice