Искусство не умерло, оно создано машинами

Переиздано Платоном

Читают: 0

Почему модели ИИ заменят художников задолго до того, как заменят программистов

Возможно, самое ошеломляющее следствие, которое мы видим в генеративном искусственном интеллекте, заключается в том, что, вопреки распространенному мнению, что творчество станет последним бастионом человеческой изобретательности перед лицом автоматизации, на самом деле оно кажется гораздо проще автоматизировать скорее сложные творческие задачи, чем автоматизировать относительно простые задачи по программированию. Чтобы понять это, мы сравним два наиболее популярных варианта использования генеративного ИИ: генерацию кода и генерацию изображений. Но мы считаем, что это утверждение справедливо в более общем плане, даже несмотря на то, что генеративные модели расширяются до более сложных приложений.

Краткая версия аргумента (которую мы рассмотрим более подробно ниже) заключается в том, что, хотя такой продукт, как Второй пилот GitHubВ своей нынешней форме может сделать кодирование несколько более эффективным, но это не устраняет необходимости в опытных разработчиках программного обеспечения со знаниями в области программирования. Одна из главных причин заключается в том, что когда дело доходит до создания программы, правильность действительно имеет значение. Если ИИ создает программу, ему все равно требуется человек, чтобы проверить ее правильность — усилия почти того же уровня, что и ее первоначальное создание.

С другой стороны, любой, кто умеет печатать, может использовать такую модель, как Стабильная диффузия создавать высококачественные, уникальные изображения за считанные минуты и с меньшими затратами на многие порядки. Продукты творческой работы часто не имеют строгих ограничений на корректность, а результаты моделей потрясающе полны. Трудно не увидеть полного фазового сдвига в отраслях, которые полагаются на креативные визуальные эффекты, потому что для многих применений визуальные эффекты, которые ИИ способен создавать сейчас, уже достаточны, а мы все еще находимся на самых ранних стадиях развития технологии.

Мы полностью осознаем, что трудно быть уверенным в каких-либо прогнозах, учитывая темпы развития отрасли. Однако сейчас кажется, что мы с гораздо большей вероятностью увидим приложения, наполненные творческими изображениями, созданными исключительно программистами, чем приложения с созданным человеком искусством, созданным исключительно создателями.

Откуда такой ажиотаж и почему именно сейчас?

Прежде чем мы углубимся в особенности генерации кода по сравнению с генерацией изображений, полезно понять, насколько популярен ИИ в целом и генеративный ИИ в частности в настоящий момент.

Генеративный ИИ пользуется самым быстрым распространением среди разработчиков, которых мы когда-либо видели. На момент написания этой статьи Stable Diffusion легко возглавляет рейтинги репозиториев GitHub с большим отрывом.. Его рост намного опережает любые последние технологии в инфраструктуре или криптографии (см. рисунок выше). Почти ежедневно появляются объявления о запуске и финансировании стартапов, использующих эту технологию, а онлайн-социальные сети наводнены контентом, созданным с помощью генеративных моделей.

Общий уровень инвестиций в ИИ за последнее десятилетие также трудно переоценить. С середины 2010-х годов мы наблюдаем экспоненциальный рост количества публикаций (см. рисунок ниже). Сегодня около 20% всех статей, публикуемых на arXiv, посвящены искусственному интеллекту, машинному обучению и НЛП. Важно отметить, что теоретические результаты пересекли критический порог, когда их стало легко использовать, и спровоцировали кембрийский взрыв новых технологий, программного обеспечения и стартапов.

Самый последний всплеск на рисунке выше во многом связан с генеративным ИИ. За одно десятилетие мы прошли путь от моделей искусственного интеллекта, предназначенных только для экспертов, которые могли бы классифицировать изображения и создавать встраивания слов, к общедоступным моделям, которые могут писать эффективный код и создавать удивительно точные изображения, используя подсказки на естественном языке. Неудивительно, что темпы инноваций только ускорились, и неудивительно, когда генеративные модели начинают проникать в другие области, где когда-то доминировали люди.

Генеративный искусственный интеллект и программирование

Одним из первых применений генеративного ИИ было помощь программистам. Это работает так: модель обучается на большом корпусе кода (например, на всех публичных репозиториях в GitHub), а затем вносит предложения программисту по мере его написания. Результаты выдающиеся. Настолько, что вполне разумно, что в будущем этот подход станет синонимом программирования.

Искусство не умерло, это всего лишь машинно-генерируемый анализ данных PlatoBlockchain. Вертикальный поиск. Ай. — Сгенерированный код: защита от атак, не использующих точки с запятой.

Однако прирост производительности был скромным по сравнению с созданием изображений, о котором мы поговорим ниже. Частично причина этого, как упоминалось выше, заключается в том, что правильность имеет решающее значение в программировании (и, действительно, в инженерных проблемах в более широком смысле, но в этой статье мы сосредоточимся на программировании). Например, недавнее исследование нашло что для сценариев, соответствующих высокому риску CWE (общие перечисления слабостей)40% кода, сгенерированного ИИ, содержали уязвимости.

Таким образом, пользователю приходится находить баланс между генерацией достаточного количества кода, чтобы обеспечить значительный прирост производительности, и в то же время ограничивать его, чтобы можно было проверить правильность. В результате Copilot имеет помог повысить продуктивность разработчиков — недавние исследования (здесь и здесь) получить выигрыш порядка 2х или меньше, но на уровне, соответствующем тому, что мы видели в предыдущих достижениях языков и инструментов разработки. Например, переход с ассемблера на C, по некоторым оценкам, повысил производительность в 2–5 раз.

У более опытных программистов проблемы могут выходить за рамки правильности кода и касаться общего качества кода. Как быстрый.айДжереми Ховард объяснил что касается последних версий модели OpenAI Codex, «[Я] не пишу подробный код, потому что он генерирует в среднем код. Для меня взять средний код и превратить его в код, который мне нравится и который я знаю, что он правильный, гораздо медленнее, чем просто писать его с нуля — по крайней мере, на языках, которые я хорошо знаю».

Таким образом, хотя очевидно, что генеративное программирование является ступенчатой функцией производительности разработчиков, неясно, насколько существенное улучшение отличается от тех, которые мы видели раньше. Генеративный ИИ делает программистов лучше, но программировать они все равно должны.

Генеративный искусственный интеллект и визуальные эффекты

С другой стороны, влияние генеративных моделей на результаты творческой работы, например создание изображений, чрезвычайно велико. Это привело к повышению эффективности и затрат на многие порядки, и трудно не увидеть, что это знаменует фазовый сдвиг во всей отрасли.

Способ работы генеративного ИИ в этой области заключается в получении от пользователя простых текстовых данных, называемых подсказками, а затем модель генерирует визуальный вывод. В настоящее время существуют модели для создания множества выходных форматов, включая изображения, видео, 3D-модели и текстуры.

Что особенно интересно, так это то, как эти модели можно расширить для создания новых или специфичных для предметной области изображений практически без творческого вмешательства. Например, Гвидо (один из авторов) взял предварительно обученную модель изображения и повторно обучил ее на нескольких десятках своих фотографий. Оттуда он смог создавать изображения, используя в подсказке. Ниже приведены фотографии, созданные по следующим подсказкам:» как Капитан Америка"," в Париже"," на картине».

В то время как генерация изображений является массовым отходом от генерации кода в бизнес-контексте, настолько же генеративный ИИ меняет экономические расчеты. Чтобы создать приведенные выше изображения, Гвидо обучил модель на нескольких фотографиях, стоимость которых составляет около 50 долларов США в виде инфраструктурных ресурсов.. После обучения генерация изображений стоит около 0.001 доллара США. в вычислительных ресурсах и может выполняться в облаке или на ноутбуке последнего поколения. Далее генерация изображения занимает всего несколько секунд.

Без генеративного ИИ единственный способ получить индивидуальное изображение — это либо нанять художника, либо сделать это самостоятельно. Даже если начать с предположения, что человек может создать полностью индивидуальное фотореалистичное изображение за один час за 10 долларов. подход с генеративным ИИ на четыре порядка дешевле и на порядок быстрее. Если говорить более реалистично, то любой проект индивидуального художественного оформления или графического дизайна, скорее всего, займет дни или недели и будет стоить сотни, если не тысячи долларов.

Подобно средствам программирования, описанным выше, генеративный ИИ будет принят в качестве инструмента художниками, и оба требуют определенной степени контроля со стороны пользователя. Но трудно переоценить разницу в экономике, создаваемую способностью модели изображения имитировать полную работу художника. Используя модель генерации кода, написание даже самой простой функциональной программы, выполняющей стандартную вычислительную задачу, требует проверки, редактирования и добавления тестов для многих фрагментов кода. Но для базового изображения ввод подсказки и выбор изображения из дюжины предложений можно выполнить менее чем за минуту.

Возьмем, к примеру, нашего карикатуриста (и инвестиционного партнера) Йоко Ли (@stuffyokodraws). Мы обучили модель, используя 70 ее предыдущих изображений, и модель смогла генерировать изображения с жутковатым уровнем мимикрии. Каждому художнику приходится придумать, что создавать дальше, и она даже обнаружила, что обученные модели могут предложить больше вариантов, чем она имела в виду — по крайней мере, когда их заставляют создать что-то в течение определенного периода времени. Существуют сотни способов нарисовать один и тот же объект, но генеративные модели сразу показали, какие пути стоит изучить.

Поэтому, когда дело доходит до таких задач, мы не утверждаем, что компьютеры обязательно better чем у людей в соотношении 1:1. Но, как и во многих других задачах, когда компьютеры могут выполнять полную работу, они просто убивают нас. лестница.

Попробуйте угадать, какие из рисунков ниже были нарисованы непосредственно Йоко, а какие — сгенерированы.

Значительное улучшение экономики, гибкость в создании новых стилей и концепций, а также способность генерировать полный или почти полный результат работы позволяют нам предположить, что мы готовы увидеть заметные изменения во всех отраслях, где творческие активы являются ключевым фактором. основная часть бизнеса. И это не ограничивается изображениями, а касается всей области дизайна. Например:

Генеративный искусственный интеллект может создавать 2D-изображения, текстуры, 3D-модели и помогать в дизайне уровней для игр.
В маркетинге он, похоже, заменит стоковые изображения, фотографии продуктов и иллюстрации.
Мы уже видим применение в веб-дизайне, дизайне интерьера и ландшафтном дизайне.

И мы действительно только в самом начале. Если вариант использования требует творческой генерации контента, трудно найти аргумент, почему генеративный ИИ не нарушит его или, по крайней мере, не станет частью процесса.

Хорошо, а в чем смысл этого поста? Хотя он несколько узко сфокусирован на генерации кода и изображений, мы подозреваем, что результаты справедливы и в более широком смысле. В частности, творческие начинания по всем направлениям — будь то визуальные, текстовые или музыкальные — скорее всего, будут нарушены ИИ задолго до создания систем.

В дополнение к аргументу правильности, который мы использовали выше, также может оказаться, что объединение и рекомбинация всего предшествующего уровня техники может оказаться достаточным для практического диапазона творческих результатов. Например, музыкальная и киноиндустрия исторически создавала бесчисленное количество подделок популярных альбомов и фильмов. Вполне возможно, что генеративные модели со временем помогут автоматизировать эти функции. Однако во многих изображениях, созданных с помощью Stable Diffusion и DALL-E 2, примечательно то, что они действительно хороши и искренне интересный. Нетрудно представить себе модель ИИ, производящую действительно интересные сочетания музыкальных стилей или даже «пишущую» полнометражные фильмы, интригующие тем, как они связывают воедино концепции и стили.

Напротив, трудно представить, что предыдущие системы будут содержать все инструменты, которые нам понадобятся для разработки всех будущих систем. Или даже то, что сложные системы можно так же легко комбинировать, как различные стили искусства или музыки. Очень часто ценность системы и то, почему ее так сложно построить, кроется в длинном хвосте деталей — всех компромиссах, обходных путях, оптимизациях для данного пространства проектирования и институциональных/скрытых знаниях, которые они содержат. Так что продолжать строить мы должны.

Мы будем сопротивляться желанию предсказать точно, как генеративный искусственный интеллект повлияет на творческую индустрию. Однако, история показывает, что новые инструменты имеют тенденцию расширять вместо того, чтобы сузить определение искусстваи сделать его доступным для новых типов художников.. В данном случае новые художники — строители систем. Так, мы считаем, что для основателей технологических компаний генеративный искусственный интеллект является исключительно позитивным инструментом. для расширения возможностей программного обеспечения – игры станут красивее, маркетинг – более привлекательным, письменный контент – более привлекательным, фильмы – более вдохновляющими.

Кто знает: однажды интернет-архив конца 2022 года может стать одним из последних хранилищ контента, созданного в основном людьми. По крайней мере, этот текст для этой статьи был полностью создан людьми.

Мнения, выраженные здесь, принадлежат отдельным цитируемым сотрудникам AH Capital Management, LLC («a16z») и не являются мнением a16z или ее аффилированных лиц. Определенная информация, содержащаяся здесь, была получена из сторонних источников, в том числе от портфельных компаний фондов, управляемых a16z. Хотя информация взята из источников, считающихся надежными, a16z не проводила независимую проверку такой информации и не делает никаких заявлений о текущей или неизменной точности информации или ее уместности в данной ситуации. Кроме того, этот контент может включать стороннюю рекламу; a16z не просматривал такие рекламные объявления и не поддерживает какой-либо рекламный контент, содержащийся в них.

Этот контент предоставляется только в информационных целях и не может рассматриваться как юридическая, деловая, инвестиционная или налоговая консультация. Вы должны проконсультироваться со своими советниками по этим вопросам. Ссылки на любые ценные бумаги или цифровые активы предназначены только для иллюстративных целей и не представляют собой инвестиционную рекомендацию или предложение предоставить консультационные услуги по инвестициям. Кроме того, этот контент не предназначен и не предназначен для использования какими-либо инвесторами или потенциальными инвесторами, и ни при каких обстоятельствах на него нельзя полагаться при принятии решения об инвестировании в какой-либо фонд, управляемый a16z. (Предложение инвестировать в фонд a16z будет сделано только в меморандуме о частном размещении, договоре о подписке и другой соответствующей документации любого такого фонда, и их следует читать полностью.) Любые инвестиции или портфельные компании, упомянутые, упомянутые или описанные не являются репрезентативными для всех инвестиций в транспортные средства, управляемые a16z, и нет никаких гарантий, что инвестиции будут прибыльными или что другие инвестиции, сделанные в будущем, будут иметь аналогичные характеристики или результаты. Список инвестиций, сделанных фондами, управляемыми Andreessen Horowitz (за исключением инвестиций, в отношении которых эмитент не предоставил разрешение на публичное раскрытие информации a16z, а также необъявленных инвестиций в публично торгуемые цифровые активы), доступен по адресу https://a16z.com/investments. /.

Диаграммы и графики, представленные в нем, предназначены исключительно для информационных целей, и на них не следует полагаться при принятии каких-либо инвестиционных решений. Прошлые показатели не свидетельствуют о будущих результатах. Содержание говорит только по состоянию на указанную дату. Любые прогнозы, оценки, прогнозы, цели, перспективы и/или мнения, выраженные в этих материалах, могут быть изменены без предварительного уведомления и могут отличаться или противоречить мнениям, выраженным другими. Пожалуйста, посетите https://a16z.com/disclosures для получения дополнительной важной информации.

Отметка времени: 16 ноября 202216 ноября 2022