Meta przedstawia nową generację filmów AI Emu i edycji Emu

Meta przedstawia nową generację filmów AI Emu i edycji Emu

Meta przedstawia nową generację AI Emu Video i Emu Edit PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

W dziedzinie generatywnej sztucznej inteligencji następuje szybki postęp, a rok 2023 będzie znaczącym krokiem w tej dziedzinie. Meta, dawniej Facebook, przedstawiła Emu, przełomowy, podstawowy model generowania obrazu, podczas tegorocznego wydarzenia Meta Connect. Ten technologia stanowi podstawę licznych doświadczeń związanych ze sztuczną inteligencją w całej rodzinie aplikacji Meta, zwłaszcza w narzędziach do edycji obrazów AI na Instagramie. Narzędzia te umożliwiają użytkownikom przekształcanie zdjęć poprzez zmianę ich stylu wizualnego lub tła. Co więcej, funkcja Imagine w Meta AI ułatwia generowanie fotorealistycznych obrazów w wiadomościach lub czatach grupowych.

Przełomy w generowaniu wideo: wideo Emu

Emu Video jawi się jako kluczowy rozwój, wykorzystujący model Emu do generowania tekstu na wideo. To innowacyjne podejście, oparte na modelach dyfuzyjnych, oferuje prostą, ale skuteczną metodę tworzenia wysokiej jakości filmów. Proces obejmuje dwie fazy: początkowo generowanie obrazów na podstawie podpowiedzi tekstowych, a następnie tworzenie filmów opartych zarówno na tekście, jak i obrazach. Ta faktoryzowana metodologia pozwala na efektywne szkolenie modeli generacji wideo. Przewaga Emu Video jest oczywista, ponieważ do wytworzenia filmów w rozdzielczości 512 × 512 przy 16 fps potrzebne są jedynie dwa modele dyfuzyjne, co stanowi wyraźny kontrast w stosunku do poprzednich metod wymagających wielu modeli. Oceny przeprowadzone na ludziach wykazały zdecydowaną preferencję dla Emu Video, którego wydajność przewyższa poprzednie technologie zarówno pod względem jakości, jak i zgodności z komunikatami tekstowymi.

Rewolucyjna edycja obrazów: edycja Emu

Meta Emu Edit reprezentuje zmianę paradygmatu w edycji obrazów, koncentrując się na precyzyjnych zmianach na poziomie pikseli. To narzędzie umożliwia skomplikowane zadania edycyjne, takie jak modyfikacje lokalne i globalne, dostosowywanie tła oraz transformacje kolorów i geometrii. Emu Edit wyróżnia się tym, że zmieniane są tylko piksele istotne dla instrukcji edycji, zachowując integralność niezamierzonych części obrazu. Aby wyszkolić Emu Edit, Meta opracowała obszerny zbiór danych składający się z 10 milionów zsyntetyzowanych próbek, z których każda zawiera obraz wejściowy, opis zadania edycyjnego i docelowy obraz wyjściowy. Model charakteryzuje się wyjątkową wydajnością pod względem wierności instrukcji i jakości obrazu.

Przyszłość generatywnej sztucznej inteligencji w Meta

Te postępy w generatywnej sztucznej inteligencji wskazują na przyszłość, w której twórcza ekspresja będzie bardziej dostępna i różnorodna. Emu Video i Emu Edit mogą potencjalnie zrewolucjonizować sposób, w jaki ludzie tworzą i udostępniają media. Oferują narzędzia dla każdego, od profesjonalnych artystów po zwykłych użytkowników, umożliwiając nowe formy ekspresji i kreatywności. Chociaż nie zastępują profesjonalnych twórców, stanowią platformę do lepszego wyrażania siebie i twórczych poszukiwań.

Doniesienia medialne podkreślają usprawniony proces Emu Video i precyzyjne możliwości edycji na poziomie pikseli w Emu Edit. Podkreślono prostotę i wydajność tej technologii, a także jej potencjał zrewolucjonizowania edycji wideo i obrazów. Jednakże Meta ostrożnie podchodzi do wdrażania rozwiązań AI, biorąc pod uwagę rygorystyczną kontrolę ze strony organów regulacyjnych. Meta wyjaśniła, że ​​jej możliwości AI nie będą dostępne w kampaniach marketingowych ani politycznych na Facebooku i Instagramie. Niemniej jednak podstawowe przepisy reklamowe platformy nie dotyczą obecnie konkretnie sztucznej inteligencji.

Źródło obrazu: Shutterstock

Znak czasu:

Więcej z Blok Chain Aktualności