Зробіть відео за допомогою ШІ та кількома словами: ознайомтеся з новим інструментом Meta

Перевидано Платоном

читають: 0

Рейчел Мец, CNN Business

Штучний інтелект стає все кращим і кращим у створенні зображення у відповідь на кілька слів завдяки загальнодоступним генераторам зображень ШІ, таким як DALL-E 2 і Stable Diffusion. Тепер дослідники Meta роблять штучний інтелект ще далі: вони використовують його для створення відео з текстових підказок.

Генеральний директор Meta Марк Цукерберг опублікував у Facebook у четвер про дослідження, Називаний Зробіть відео, з 20-секундним кліпом, який зібрав кілька текстових підказок, використаних дослідниками Meta, і отримані (дуже короткі) відео. Серед підказок: «Плюшевий ведмедик малює автопортрет», «Космічний корабель приземляється на Марс», «Немовля-лінивець у в’язаній шапочці намагається зрозуміти ноутбук» і «Робот, який пливе по хвилі в океані».

Відео для кожної підказки триває всього кілька секунд, і вони зазвичай показують те, що пропонує підказка (за винятком дитинчати лінивця, яке не дуже схоже на справжню істоту), у досить низькій роздільній здатності та дещо уривчасто стиль. Незважаючи на це, це демонструє новий напрямок досліджень штучного інтелекту, оскільки системи стають все більш успішними у створенні зображень зі слів. Однак якщо ця технологія врешті-решт буде широко розповсюджена, це викличе багато тих самих проблем, які викликали системи перетворення тексту в зображення, наприклад, що її можна використовувати для поширення дезінформації через відео.

Веб -сторінка для Make-A-Video включає ці короткі кліпи та інші, деякі з яких виглядають досить реалістично, наприклад відео, створене у відповідь на підказку «Риба-клоун пливе крізь кораловий риф» або такий, що має на меті показати «Молода пара йде під сильним дощем».

У своєму дописі на Facebook Цукерберг зазначив, як складно створити рухоме зображення з кількох слів.

«Згенерувати відео набагато важче, ніж фотографії, тому що крім правильного генерування кожного пікселя, система також має передбачити, як вони будуть змінюватися з часом», — написав він.

Дослідницька робота в описі роботи пояснюється, що проект використовує модель штучного інтелекту перетворення тексту в зображення, щоб визначити, як слова співвідносяться з зображеннями, а також техніку штучного інтелекту, відому як непідконтрольне навчання — у якому алгоритми вивчають дані, які не позначені, щоб розрізняти в них закономірності — переглядають відео та визначають, як виглядає реалістичний рух.

Як і у випадку з масивними, популярними системами штучного інтелекту, які генерують зображення з тексту, дослідники відзначили, що їхня модель штучного інтелекту «текст-у-зображення» була навчена на даних Інтернету, що означає, що вона навчилася «і, ймовірно, перебільшила соціальні упередження, у тому числі шкідливі», дослідники написав. Вони зауважили, що відфільтрували дані за «вмістом NSFW і токсичними словами», але оскільки набори даних можуть включати багато мільйонів зображень і тексту, можливо, неможливо видалити весь такий вміст.

Цукерберг написав, що в майбутньому Meta планує поділитися проектом Make-A-Video як демо.

Часова мітка: Вересень 30, 2022Вересень 30, 2022

Часова мітка: Вересень 21, 2022

Перевидано Платоном

ФРС може обвалити ринок нерухомості

Повітряний стартап Sustaera від Cary призначає керівника з переробки газу новим генеральним директором

Epic оживляє ринки архітектури, інженерії та будівництва за допомогою захоплюючих інструментів

Звіти про прибутки: Bioventus, Humacyte, Guerrilla RF, Novan, Liquidia тощо

Компанія з виробництва будівельних товарів Woodgrain, яка розширюється в Рокі-Маунт, найме більше працівників

FTC «вдруге» розглядає плани Amazon придбати iRobot, One Medical

Apple пропонує «екстремальний» рівень безпеки – ось як його ввімкнути

Більше звільнень: Wayfair скорочує 5% своєї глобальної робочої сили

Від А до Я, NC TECH називає фіналістів щорічних нагород

Google Fiber, який має зростаюче охоплення NC, поширюється ще на п’ять штатів

Використання найновіших технологій Apple: дивіться або слухайте інсайдерські поради від MacRumors

Багаті стають ще багатшими: у США з’явилося 2.5 мільйона мільйонерів; більше 62.5 мільйонів зараз у всьому світі

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки