Мистецтво не мертве, воно лише створене машиною

Перевидано Платоном

читають: 0

Чому моделі ШІ замінять художників задовго до того, як вони замінять програмістів

Мабуть, найбільш приголомшливий висновок, який ми бачимо від генеративного штучного інтелекту, полягає в тому, що, всупереч поширеній думці про те, що творчість стане останнім бастіоном людської винахідливості перед лицем автоматизації, він насправді виглядає набагато простіше автоматизувати досить складні творчі завдання, ніж автоматизувати відносно прості завдання програмування. Щоб отримати уявлення про це, ми порівнюємо два найбільш популярних випадки використання генеративного штучного інтелекту: генерація коду та генерація зображень. Але ми вважаємо, що це твердження справедливе в більш загальному плані, навіть якщо генеративні моделі поширюються на більш складні програми.

Коротка версія аргументу (про який ми розглянемо більш детально нижче) полягає в тому, що хоча продукт, як Копілот GitHub, у своїй поточній формі, може зробити кодування дещо ефективнішим, це не позбавляє потреби в здібних розробниках програмного забезпечення зі знаннями програмування. Однією з головних причин є те, що, коли йдеться про створення програми, правильність справді має значення. Якщо штучний інтелект генерує програму, людині все одно потрібна перевірка її правильності — зусилля майже на тому ж рівні, що й її створення.

З іншого боку, кожен, хто вміє друкувати, може використовувати модель, як Стабільна дифузія створювати високоякісні, єдині у своєму роді зображення за лічені хвилини з меншими витратами на багато порядків. Продукти творчої роботи часто не мають строгих обмежень щодо правильності, а результати моделей є вражаюче повними. Важко не помітити повного фазового зсуву в галузях, які покладаються на креативні візуальні ефекти, тому що для багатьох застосувань візуальних зображень, які зараз здатний виробляти штучний інтелект, уже достатньо, а ми все ще перебуваємо на самому початку розвитку цієї технології.

Ми повністю визнаємо, що важко бути впевненим у будь-яких прогнозах з огляду на темпи, якими розвивається сфера. Однак наразі здається, що ми з більшою ймовірністю побачимо програми, наповнені креативними зображеннями, створеними виключно програмістами, ніж програми з мистецтвом, розробленим людьми, створеним виключно творцями.

Чому ажіотаж і чому зараз?

Перш ніж перейти до специфіки генерації коду та генерації зображень, корисно зрозуміти, наскільки популярним на даний момент ШІ загалом і генеративний ШІ, зокрема.

Розробники найшвидше засвоюють Generative AI. Поки ми це пишемо, Stable Diffusion з великим відривом очолює чарти трендів у сховищах GitHub. Його зростання значно випереджає будь-яку новітню технологію в інфраструктурі чи криптографії (див. малюнок вище). Майже щодня публікуються оголошення про запуск та фінансування стартапів, які використовують цю технологію, а онлайн-соціальні мережі переповнені контентом, створеним генеративними моделями.

Загальний рівень інвестицій у ШІ за останнє десятиліття також важко переоцінити. З середини 2010-х ми спостерігаємо експоненціальне зростання лише публікацій (див. малюнок нижче). Сьогодні близько 20% усіх статей, розміщених на arXiv, стосуються штучного інтелекту, машинного навчання та НЛП. Важливо те, що теоретичні результати перетнули критичний поріг, де їх стало легко використати, і спровокували кембрійський вибух нових технологій, програмного забезпечення та стартапів.

Останній сплеск на малюнку вище здебільшого пов’язаний із генеративним ШІ. За одне десятиліття ми перейшли від моделей штучного інтелекту лише для експертів, які могли класифікувати зображення та створювати вставлення слів, до загальнодоступних моделей, які можуть писати ефективний код і створювати неймовірно точні зображення, використовуючи підказки природної мови. Не дивно, що темп інновацій лише прискорився, і не повинно бути дивно, коли генеративні моделі починають проникати в інші сфери, де колись панувала людина.

Генеративний ШІ та програмування

Одним із найперших застосувань генеративного штучного інтелекту був як допомога програмісту. Принцип роботи полягає в тому, що модель навчається на великому масиві коду (наприклад, на всіх загальнодоступних сховищах у GitHub), а потім робить пропозиції програмісту під час кодування. Результати чудові. Настільки, що розумно, що цей підхід у майбутньому стане синонімом програмування.

Мистецтво не мертве, це просто згенеровані машиною дані PlatoBlockchain Intelligence. Вертикальний пошук. Ai. — Згенерований код: захист від атак, які не використовують крапку з комою.

Однак приріст продуктивності був скромним порівняно зі створенням зображень, про що ми розповідаємо нижче. Частково причиною цього, як згадувалося вище, є те, що правильність має вирішальне значення для програмування (і справді, інженерних проблем у ширшому плані, але ми зосереджуємося на програмуванні в цій публікації). Наприклад, знайдено недавнє дослідження це для сценаріїв, що відповідають високому ризику CWE (загальні переліки слабких місць)40% згенерованого ШІ коду містили вразливості.

Таким чином, користувач має знайти баланс між створенням достатньої кількості коду, щоб забезпечити суттєве підвищення продуктивності, і водночас обмежити його, щоб можна було перевірити правильність. В результаті Copilot має допоміг підвищення продуктивності розробників — останні дослідження (тут та тут) отримати приріст у 2 рази або менше, але на рівні з тим, що ми бачили в попередніх досягненнях мов розробника та інструментів. Наприклад, перехід від складання до C, за деякими оцінками, підвищив продуктивність у 2-5 разів.

Досвідченіших програмістів хвилювання можуть поширюватися не тільки на правильність коду, але й на загальну якість коду. як швидко.айДжеремі Ховард пояснив щодо останніх версій моделі OpenAI Codex, "[Я] пишу докладний код, оскільки він генерує середній код. Для мене взяти середній код і перетворити його на код, який мені подобається і я знаю, що він правильний, набагато повільніше, ніж просто писати його з нуля — принаймні мовами, які я добре знаю».

Отже, незрозуміло, що генеративне програмування є кроком у продуктивності розробника, але незрозуміло, що покращення кардинально відрізняється від тих, які ми бачили раніше. Generative AI робить кращих програмістів, але вони все одно повинні програмувати.

Генеративний ШІ та візуальні ефекти

З іншого боку, вплив генеративних моделей на продуктивність творчої роботи, наприклад створення зображень, є надзвичайним. Це призвело до значного підвищення ефективності та вартості на багато порядків, і важко не побачити, як це поклало початок фазовому зсуву в усій галузі.

Те, як генеративний штучний інтелект працює в цьому просторі, полягає в тому, щоб приймати прості текстові дані від користувача, які називаються підказками, а потім модель генерує візуальний результат. Наразі існують моделі для створення багатьох вихідних форматів, включаючи зображення, відео, 3D-моделі та текстури.

Що особливо цікаво, так це те, як ці моделі можна розширити для створення нових або предметно-спеціальних зображень майже без творчого втручання. Наприклад, Гвідо (один з авторів) взяв попередньо навчену модель зображення і перетренував її на кількох десятках своїх фотографій. Звідти він зміг створити зображення за допомогою у підказці. Нижче наведено фотографії, створені на основі таких підказок: " як капітан америка»,« у Парижі»,« в картині".

Там, де генерація зображень є значним відхиленням від генерації коду в бізнес-контексті, це ступінь, до якого генеративний ШІ змінює економічні розрахунки. Щоб створити наведені вище фотографії, Гвідо навчив модель на кількох фотографіях, вартістю близько 50 доларів США в інфраструктурних ресурсах. Після навчання генерація зображень коштує приблизно 0.001 дол в обчислювальних ресурсах і може бути виконано в хмарі або на ноутбуці останнього покоління. Крім того, створення зображення займає всього кілька секунд.

Без генеративного штучного інтелекту єдиний спосіб отримати власне зображення — найняти художника або зробити це самостійно. Навіть якщо ми почнемо з припущення, що людина може створити повністю індивідуальне, фотореалістичне зображення протягом однієї години за 10 доларів, генеративний підхід штучного інтелекту легко на чотири порядки дешевший і на порядок швидший. Реалістичніше кажучи, будь-який нестандартний твір мистецтва чи проект графічного дизайну, ймовірно, займе кілька днів або тижнів і коштуватиме сотні, якщо не тисячі, доларів.

Подібно до наведених вище засобів програмування, буде генеративний ШІ прийнятий як інструмент художниками, і обидва вимагають певного контролю користувача. Але важко переоцінити різницю в економіці, яку створює здатність моделі зображення імітувати повний результат художника. Використовуючи модель генерації коду, написання навіть дуже простої функціональної програми, яка виконує стандартне обчислювальне завдання, вимагає перегляду, редагування та додавання тестів для багатьох фрагментів коду. Але для основного зображення введення підказки та вибір зображення з дюжини пропозицій можна виконати менше ніж за хвилину.

Візьмемо, наприклад, нашого власного карикатуриста (та інвестиційного партнера) Йоко Лі (@stuffyokodraws). Ми навчали модель, використовуючи 70 її попередніх зображень, і модель змогла створити зображення з моторошним рівнем мімікрії. Кожен художник має зрозуміти, що створити далі, і вона навіть виявила, що навчені моделі можуть висвітлити більше варіантів, ніж те, що вона мала в своєму розумі — принаймні, коли їх вимагають створити щось за певний період часу. Існують сотні способів намалювати той самий об’єкт, але генеративні моделі відразу зробили очевидним, які шляхи варто досліджувати.

Тож коли справа доходить до таких завдань, ми не сперечаємося, що комп’ютери обов’язкові краще ніж люди в співвідношенні 1:1. Але як і з багатьма іншими завданнями, коли комп’ютери можуть виробляти повну роботу, вони просто вбивають нас масштаб.

Спробуйте вгадати, які з наведених нижче малюнків намалювала Йоко безпосередньо, а які згенерувала.

Масштабне вдосконалення економіки, гнучкість у створенні нових стилів і концепцій, а також здатність генерувати повний або майже повний результат роботи вказують на те, що ми готові побачити помітні зміни в усіх галузях, де творчі ресурси є важливим основна частина бізнесу. І це не обмежується зображеннями, а стосується всього дизайну. Наприклад:

Generative AI може створювати 2D зображення, текстури, 3D моделі та допомагати з дизайном рівнів для ігор.
У маркетингу він, схоже, готовий замінити стокове мистецтво, фотографію продукту та ілюстрацію.
Ми вже бачимо застосування у веб-дизайні, дизайні інтер’єру та ландшафтному дизайні.

І насправді ми лише на початку. Якщо сценарій використання вимагає креативного створення контенту, важко зрозуміти, чому генеруючий штучний інтелект не порушить його чи принаймні стане частиною процесу.

Гаразд, у чому суть цієї публікації? Незважаючи на те, що він дещо вузько зосереджений на генерації коду та генерації зображень, ми підозрюємо, що результати справедливі в ширшому плані. Зокрема, штучний інтелект задовго до побудови систем може перешкодити творчим заходам — візуальним, текстовим чи музичним.

На додаток до аргументу правильності, який ми використовуємо вище, також може бути так, що об’єднання та рекомбінування всього рівня техніки може бути достатнім для практичного діапазону творчих результатів. Музична та кіноіндустрія, наприклад, історично створювала незліченну кількість копій популярних альбомів і фільмів. Цілком можливо, що генеративні моделі можуть допомогти автоматизувати ці функції з часом. Однак дивовижна річ у багатьох зображеннях, створених Stable Diffusion і DALL-E 2, полягає в тому, що вони дійсно хороші та щиро цікаво. Неважко уявити модель штучного інтелекту, яка створює справді цікаві поєднання музичних стилів або навіть «пише» повнометражні фільми, які інтригують тим, як вони поєднують концепції та стилі.

Навпаки, важко уявити, що попередні системи міститимуть усі інструменти, необхідні для розробки всіх майбутніх систем. Або навіть те, що складні системи можна так само легко комбінувати, як різні стилі мистецтва чи музики. Тому часто цінність системи та те, чому її так важко побудувати, полягає в довгому хвості деталей — усіх компромісах, обхідних шляхах, оптимізації для певного простору дизайну та інституційних/прихованих знаннях, які вони містять. Тому ми повинні продовжувати будувати.

Ми втримаємося від бажання прогнозувати точно як генеративний ШІ вплине на творчу індустрію. однак, Історія показує, що нові інструменти мають тенденцію до Розширювати а не договір визначення ст, і зробити його доступним для нових типів художників. У цьому випадку нові художники є розробниками систем. Так, для засновників технологічних компаній ми вважаємо, що генеративний ШІ є суто позитивним інструментом для розширення охоплення програмного забезпечення – ігри стануть красивішими, маркетинг – привабливішим, письмовий вміст – привабливішим, фільми – більш надихаючими.

Хто знає: одного разу архів Інтернету кінця 2022 року може бути цінним як одне з останніх сховищ контенту, створеного переважно людьми. Цей текст для цієї статті, принаймні, був повністю створений людьми.

***

Погляди, висловлені тут, є поглядами окремих співробітників AH Capital Management, LLC («a16z»), які цитуються, і не є поглядами a16z або його філій. Певна інформація, що міститься тут, була отримана зі сторонніх джерел, зокрема від портфельних компаній фондів, якими керує a16z. Хоча отримано з джерел, які вважаються надійними, a16z не перевіряв таку інформацію незалежно та не робить жодних заяв щодо поточної чи довгострокової точності інформації чи її відповідності певній ситуації. Крім того, цей вміст може містити рекламу третіх сторін; a16z не переглядав такі оголошення та не схвалює будь-який рекламний вміст, що міститься в них.

Цей вміст надається лише в інформаційних цілях, і на нього не можна покладатися як на юридичну, ділову, інвестиційну чи податкову консультацію. Ви повинні проконсультуватися з власними радниками щодо цих питань. Посилання на будь-які цінні папери чи цифрові активи наведено лише з метою ілюстрації та не є інвестиційною рекомендацією чи пропозицією надати інвестиційні консультаційні послуги. Крім того, цей вміст не призначений для будь-яких інвесторів чи потенційних інвесторів і не призначений для використання ними, і за жодних обставин на нього не можна покладатися при прийнятті рішення інвестувати в будь-який фонд, яким керує a16z. (Пропозиція інвестувати у фонд a16z буде зроблена лише на підставі меморандуму про приватне розміщення, угоди про підписку та іншої відповідної документації будь-якого такого фонду, і її слід читати повністю.) Будь-які інвестиційні чи портфельні компанії, згадані, згадані або описані не є репрезентативними для всіх інвестицій у транспортні засоби, якими керує a16z, і не може бути гарантії, що інвестиції будуть прибутковими або що інші інвестиції, здійснені в майбутньому, матимуть подібні характеристики чи результати. Список інвестицій, здійснених фондами під управлінням Andreessen Horowitz (за винятком інвестицій, щодо яких емітент не надав дозволу a16z на оприлюднення, а також неоголошених інвестицій у публічні цифрові активи) доступний за адресою https://a16z.com/investments /.

Наведені в ньому діаграми та графіки призначені виключно для інформаційних цілей, і на них не слід покладатися під час прийняття інвестиційних рішень. Минулі результати не вказують на майбутні результати. Зміст відповідає лише вказаній даті. Будь-які прогнози, оцінки, прогнози, цілі, перспективи та/або думки, висловлені в цих матеріалах, можуть бути змінені без попередження та можуть відрізнятися або суперечити думкам, висловленим іншими. Додаткову важливу інформацію можна знайти на сторінці https://a16z.com/disclosures.

Часова мітка: Листопад 16, 2022Листопад 16, 2022