Nakręć film za pomocą sztucznej inteligencji i kilku słów: sprawdź nowe narzędzie Meta

Opublikowane ponownie przez Plato

Obserwuje: 0

Autor: Rachel Metz, CNN Business

Sztuczna inteligencja coraz lepiej radzi sobie z generowaniem obrazu w odpowiedzi na kilka słów, dzięki ogólnodostępnym generatorom obrazów AI, takim jak DALL-E 2 i Stable Diffusion. Teraz badacze Meta idą o krok dalej ze sztuczną inteligencją: używają jej do tworzenia filmów za pomocą podpowiedzi tekstowych.

Dyrektor generalny Meta, Mark Zuckerberg w czwartek opublikowano na Facebooku informację o badaniu, Zwane Zrób wideo, z 20-sekundowym klipem zawierającym kilka podpowiedzi tekstowych, z których korzystali badacze Meta, oraz powstałe w ich wyniku (bardzo krótkie) filmy. Podpowiedzi to „Miś malujący autoportret”, „Statek kosmiczny lądujący na Marsie”, „Mały leniwiec w czapce z dzianiny próbujący rozgryźć laptopa” oraz „Robot surfujący po fali w oceanie”.

Filmy do każdego podpowiedzi trwają zaledwie kilka sekund i zazwyczaj pokazują, co sugeruje podpowiedź (z wyjątkiem małego leniwca, który nie wygląda zbytnio jak rzeczywiste stworzenie) w dość niskiej rozdzielczości i nieco nierównej styl. Mimo to pokazuje nowy kierunek badań nad sztuczną inteligencją, w miarę jak systemy stają się coraz lepsze w generowaniu obrazów ze słów. Jeśli jednak technologia ta zostanie w końcu szeroko rozpowszechniona, wzbudzi wiele takich samych obaw, jakie budzą systemy przetwarzania tekstu na obraz, np. możliwość wykorzystania jej do rozpowszechniania dezinformacji za pośrednictwem wideo.

Strona internetowa for Make-A-Video zawiera te krótkie klipy i inne, z których niektóre wyglądają dość realistycznie, np. wideo utworzone w odpowiedzi na monit „Klown pływający po rafie koralowej” lub taki, który miał pokazać „Młoda para spacerująca w ulewnym deszczu".

W swoim poście na Facebooku Zuckerberg zwrócił uwagę, jak trudne jest wygenerowanie ruchomego obrazu z kilku słów.

„Wygenerowanie wideo jest znacznie trudniejsze niż zdjęć, ponieważ poza prawidłowym generowaniem każdego piksela, system musi także przewidzieć, jak będą się one zmieniać w czasie” – napisał.

Artykuł naukowy opisując pracę wyjaśnia, że w projekcie wykorzystano model sztucznej inteligencji przekształcający tekst na obraz, aby dowiedzieć się, w jaki sposób słowa odpowiadają obrazom, oraz technikę sztucznej inteligencji znaną jako uczenie się bez nadzoru — podczas którego algorytmy przeglądają dane, które nie są oznaczone etykietami, aby rozpoznać w nich wzorce — aby obejrzeć filmy i określić, jak wygląda realistyczny ruch.

Podobnie jak w przypadku ogromnych, popularnych systemów sztucznej inteligencji, które generują obrazy z tekstu, badacze wskazali, że ich model sztucznej inteligencji przekształcający tekst na obraz został wytrenowany na danych internetowych, co oznacza, że nauczył się „i prawdopodobnie wyolbrzymił uprzedzenia społeczne, w tym szkodliwe” – twierdzą badacze. napisał. Zauważyli, że filtrowali dane pod kątem „treści NSFW i toksycznych słów”, ale ponieważ zbiory danych mogą zawierać wiele milionów obrazów i tekstu, usunięcie całej takiej treści może nie być możliwe.

Zuckerberg napisał, że Meta planuje w przyszłości udostępnić projekt Make-A-Video jako wersję demonstracyjną.

Znak czasu: 30 września 2022 r.30 września 2022 r.

Znak czasu: Września 21, 2022

Opublikowane ponownie przez Plato

Fed może załamać rynek mieszkaniowy

Firma Cary, startująca w wychwytywaniu powietrza, Sustaera wybiera dyrektora ds. przetwarzania gazu jako nowego dyrektora generalnego

Epic ożywia architekturę, inżynierię i rynki budowlane dzięki wciągającym narzędziom

Raporty o zarobkach: Bioventus, Humacyte, Guerrilla RF, Novan, Liquidia i inne

Firma Woodgrain zajmująca się produktami budowlanymi, rozwijająca się w Rocky Mount, zatrudni więcej pracowników

FTC „drugie” przygląda się planom Amazona dotyczącym zakupu iRobot, One Medical

Apple oferuje „ekstremalny” poziom bezpieczeństwa – oto jak go włączyć

Więcej zwolnień: Wayfair redukuje 5% swojej globalnej siły roboczej

Od A do Z NC TECH wyznacza finalistów corocznych nagród

Google Fiber, który ma rosnący zasięg NC, rozszerza działalność na pięć kolejnych stanów

Korzystanie z najnowszych technologii Apple: oglądaj lub słuchaj poufnych porad MacRumors

Bogaci stają się bogatsi: USA dodaje 2.5 mln milionerów; ponad 62.5 miliona na całym świecie

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto