Sora AI błyskawicznie tworzy przykuwające uwagę filmy

Sora AI błyskawicznie tworzy przykuwające uwagę filmy

Sora AI Produces Eye-Popping Videos Instantly PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Sora, imponujący nowy generatywny model wideo stworzony przez OpenAI, może pobrać krótki opis tekstowy i przekształcić go w minutowy, skomplikowany klip filmowy w wysokiej rozdzielczości.

OpenAI, spółka-matka chatbota ChatGPT i generatora obrazów nieruchomych DALL-E, jest jedną z wielu firm rywalizujących o ulepszenie tego generatora natychmiastowego wideo. Inne firmy to start-upy, takie jak Runway, oraz giganci technologiczni, tacy jak Google i Meta Platforms Inc., właściciele Facebooka i Instagrama.

Technologia ta może całkowicie zastąpić mniej wykwalifikowanych artystów cyfrowych, przyspieszając jednocześnie pracę doświadczonych filmowców.

Przeczytaj także: Współzałożyciel OpenAI, Andrej Karpathy, ustępuje ze stanowiska i rozważa osobiste przedsięwzięcia

Uwolnienie Sory

OpenAI nazwało swój nowy system Sora, co jest japońskim słowem oznaczającym niebo. Zespół opracowujący technologię, w skład którego wchodzili badacze Tim Brooks i Bill Peebles, wybrał tę nazwę, ponieważ „przywołuje ona ideę nieograniczonego potencjału twórczego”.

Powiedzieli również, że firma nie udostępniła jeszcze Sory publicznie, ponieważ wciąż badała ryzyko związane z systemem. OpenAI raczej dzieli się technologią z wybraną grupą naukowców i innych badaczy z zewnątrz, którzy będą ją tworzyć „czerwonym zespołem”, co jest terminem opisującym poszukiwanie potencjalnych nadużyć.

Według dr Brooksa chodzi o to, aby dać podgląd tego, co widać na horyzoncie, aby ludzie mogli zobaczyć możliwości tej technologii i uzyskać informacje zwrotne.

OpenAI taguje filmy

OpenAI już teraz oznacza filmy utworzone przez system znakami wodnymi, aby wskazać, że zostały wygenerowane przez sztuczną inteligencję (AI). Firma przyznaje jednak, że można je usunąć. Dodali, że ich identyfikacja może być również trudna.

Zgodnie z OpenAI, uczą sztucznej inteligencji (AI) rozumienia i symulowania świata fizycznego w ruchu, a celem jest tworzenie modeli pomagających ludziom rozwiązywać problemy wymagające interakcji w świecie rzeczywistym.

Ponadto zapewniają dostęp kilku artystom wizualnym, projektantom i filmowcom, aby uzyskać opinie na temat tego, jak ulepszyć model, aby był jak najbardziej przydatny dla kreatywnych profesjonalistów.

Dzielą się postępami w swoich badaniach już na wczesnym etapie, aby rozpocząć współpracę i uzyskać opinie od osób spoza OpenAI oraz dać społeczeństwu wyobrażenie o możliwościach sztucznej inteligencji na horyzoncie.

Rozwój Sory

Jednakże, OpenAI odmówił ujawnienia liczby filmów, z których system się dowiedział, ani źródła ich pochodzenia. Stwierdzili jedynie, że szkolenie obejmowało zarówno filmy dostępne publicznie, jak i filmy licencjonowane przez właścicieli praw autorskich.

Firma była kilkakrotnie pozwana za wykorzystywanie treści chronionych prawem autorskim. Prawdopodobnie stara się utrzymać przewagę nad konkurencją, dlatego nie ujawnia niczego na temat danych wykorzystywanych do szkolenia swoich technologii.

Co więcej, model doskonale rozumie język, co pozwala mu dokładnie interpretować podpowiedzi i tworzyć fascynujące postacie, które żywo przekazują emocje. Sora może także wykonać kilka ujęć, zachowując ujęcie wizualne i charakter pojedynczego wygenerowanego filmu.

OpenAI udostępniło monit o wygenerowanie wideo na uchwycie X, wywołując kilka reakcji użytkowników X.

Słabe strony Modelki

Według OpenAI obecny model ma słabe strony. Może potrzebować pomocy w dokładnym symulowaniu fizyki złożonej sceny i może potrzebować pomocy w zrozumieniu konkretnych przypadków przyczyny i skutku. Na przykład osoba może ugryźć ciasteczko, ale później ciasteczko może nie mieć śladu ugryzienia.

Model może również wymagać wyjaśnienia szczegółów przestrzennych podpowiedzi, na przykład pomieszania lewej i prawej strony, a także może potrzebować pomocy w zakresie precyzyjnych opisów zdarzeń, które mają miejsce w czasie, np. podążania określoną trajektorią kamery.

Znak czasu:

Więcej z MetaWiadomości