هنر نمرده است، فقط هوش داده پلاتو بلاک چین ماشینی است. جستجوی عمودی Ai.

هنر نمرده است، فقط ماشین تولید شده است

چرا مدل های هوش مصنوعی خیلی قبل از اینکه جایگزین برنامه نویسان شوند، جای هنرمندان را خواهند گرفت

شاید جالب‌ترین مفهومی که از هوش مصنوعی مولد می‌بینیم این باشد که برخلاف دیدگاه رایج که خلاقیت آخرین سنگر نبوغ انسان در مواجهه با اتوماسیون خواهد بود، در واقع به نظر می‌رسد خیلی راحت تر برای خودکارسازی کارهای خلاقانه نسبتاً دشوار نسبت به خودکارسازی وظایف برنامه نویسی نسبتاً ساده. برای درک این موضوع، دو مورد از محبوب‌ترین موارد استفاده از هوش مصنوعی مولد را مقایسه می‌کنیم: تولید کد و تولید تصویر. اما ما معتقدیم که این ادعا به‌طور کلی‌تر باقی می‌ماند، حتی زمانی که مدل‌های مولد به برنامه‌های پیچیده‌تر گسترش می‌یابند.

نسخه کوتاه این استدلال (که در زیر با جزئیات بیشتری به آن می پردازیم) این است که اگرچه یک محصول مانند خلبان GitHubدر شکل فعلی خود، می تواند کدنویسی را تا حدودی کارآمدتر کند، نیازی به توسعه دهندگان نرم افزار توانمند با دانش برنامه نویسی را برطرف نمی کند. یک دلیل بزرگ این است که وقتی نوبت به ساختن یک برنامه می رسد، درستی واقعا مهم است. اگر هوش مصنوعی برنامه ای را تولید کند، باز هم به انسان نیاز دارد تا درستی آن را تأیید کند - تلاشی تقریباً در همان سطحی که برای شروع آن ایجاد شد.

از طرف دیگر، هر کسی که می تواند تایپ کند می تواند از یک مدل مانند استفاده کند انتشار پایدار برای تولید تصاویر با کیفیت بالا و منحصر به فرد در عرض چند دقیقه، با چندین مرتبه بزرگی و هزینه کمتر. محصولات کار خلاق اغلب محدودیت های صحت دقیق ندارند و خروجی های مدل ها به طرز خیره کننده ای کامل هستند. سخت است که شاهد تغییر فاز کامل در صنایعی نباشیم که به تصاویر خلاقانه متکی هستند، زیرا برای بسیاری از کاربردها، تصاویری که هوش مصنوعی در حال حاضر قادر به تولید آن است کافی است و ما هنوز در مراحل اولیه این فناوری هستیم.

ما کاملاً اذعان داریم که سخت است به هر پیش‌بینی با سرعتی که میدان در حال حرکت است مطمئن بود. با این حال، در حال حاضر، به نظر می‌رسد که ما بیشتر احتمال دارد که برنامه‌هایی پر از تصاویر خلاقانه را ببینیم که صرفاً توسط برنامه‌نویسان ایجاد شده‌اند تا برنامه‌هایی با هنر طراحی شده توسط انسان که صرفاً توسط سازندگان ساخته شده‌اند. 

چرا هیاهو و چرا الان؟

قبل از اینکه بخواهیم به ویژگی‌های تولید کد در مقابل تولید تصویر بپردازیم، درک این موضوع که هوش مصنوعی به طور کلی و به طور خاص هوش مصنوعی مولد در حال حاضر چقدر محبوب هستند مفید است.

هوش مصنوعی مولد سریع‌ترین جذب را توسط توسعه‌دهندگانی که تاکنون دیده‌ایم مشاهده می‌کند. همانطور که ما این مقاله را می نویسیم، Stable Diffusion به راحتی با اختلاف زیادی در صدر نمودارهای ترند مخازن GitHub قرار می گیرد.. رشد آن بسیار جلوتر از هر فناوری اخیر در زیرساخت یا رمزارز است (شکل بالا را ببینید). تقریباً روزانه اعلامیه‌های راه‌اندازی و تأمین مالی استارت‌آپ‌هایی که از این فناوری استفاده می‌کنند وجود دارد، و شبکه‌های اجتماعی آنلاین مملو از محتوای ایجاد شده توسط مدل‌های مولد هستند.

سطح کلی سرمایه گذاری در هوش مصنوعی در دهه گذشته نیز به سختی قابل اغراق است. ما از اواسط دهه 2010 به تنهایی شاهد افزایش تصاعدی در انتشارات بوده ایم (شکل زیر را ببینید). امروزه، حدود 20 درصد از تمام مقالات ارسال شده در arXiv در مورد AI، ML و NLP هستند. نکته مهم این است که نتایج نظری از آستانه بحرانی عبور کرده است، جایی که به راحتی قابل مصرف شده است و باعث انفجار کامبرین از تکنیک ها، نرم افزارها و استارت آپ های جدید شده است. 

هنر نمرده است، فقط هوش داده پلاتو بلاک چین ماشینی است. جستجوی عمودی Ai.

جدیدترین افزایش در شکل بالا عمدتاً به دلیل هوش مصنوعی مولد است. در یک دهه، ما از مدل‌های هوش مصنوعی متخصص که می‌توانستند تصاویر را طبقه‌بندی کنند و جاسازی‌های کلمه ایجاد کنند، به مدل‌های قابل استفاده عمومی که می‌توانند کد مؤثر بنویسند و تصاویر بسیار دقیقی را با استفاده از اعلان‌های زبان طبیعی ایجاد کنند، تغییر کرده‌ایم. جای تعجب نیست که سرعت نوآوری فقط افزایش یافته است، و زمانی که مدل های مولد شروع به هجوم به مناطق دیگری می کنند که زمانی تحت سلطه انسان ها بود، جای تعجب نیست.

هوش مصنوعی و برنامه نویسی مولد

یکی از اولین کاربردهای هوش مصنوعی مولد کمک برنامه نویس بوده است. روش کار به این صورت است که یک مدل بر روی مجموعه بزرگی از کد آموزش داده می شود (مثلاً تمام مخازن عمومی در GitHub) و سپس در حین کدنویسی به برنامه نویس پیشنهاد می دهد. نتایج فوق العاده است. تا آنجا که منطقی است این رویکرد مترادف با برنامه نویسی در آینده خواهد شد.

هنر نمرده است، فقط هوش داده پلاتو بلاک چین ماشینی است. جستجوی عمودی Ai.
کد تولید شده: ایمن در برابر حملاتی که از نقطه ویرگول استفاده نمی کنند.

با این حال، افزایش بهره وری نسبت به تولید تصویر، که در زیر به آن می پردازیم، اندک بوده است. بخشی از دلیل این امر، همانطور که در بالا ذکر شد، این است که صحت در برنامه نویسی بسیار مهم است (و در واقع مشکلات مهندسی به طور گسترده تر، اما ما در این پست بر برنامه نویسی تمرکز می کنیم). مثلا، یک مطالعه اخیر یافت شده است که برای سناریوهای مطابق با ریسک بالا CWE (شماره‌های ضعف رایج)40 درصد کدهای تولید شده توسط هوش مصنوعی دارای آسیب‌پذیری هستند.

بنابراین، کاربر باید تعادلی بین تولید کد کافی برای افزایش بهره‌وری معنادار ایجاد کند، در حالی که همچنان آن را محدود می‌کند تا امکان بررسی صحت وجود داشته باشد. در نتیجه، Copilot دارد کمک کرد بهبود بهره وری توسعه دهندگان - مطالعات اخیر (اینجا کلیک نمایید و اینجا کلیک نمایید) سودها را در حد 2 برابر یا کمتر قرار دهید - اما به سطحی همتراز با آنچه در پیشرفت های قبلی زبان های توسعه دهنده و ابزارها دیده ایم. برای مثال، جهش از مونتاژ به C، بر اساس برخی برآوردها، بهره وری را 2 تا 5 برابر بهبود بخشید.

برای برنامه نویسان با تجربه تر، نگرانی ها ممکن است فراتر از صحت کد و کیفیت کلی کد گسترش یابد. مانند سریع .aiجرمی هاوارد توضیح داده است با توجه به نسخه های اخیر مدل OpenAI Codex، "[من] کد مفصل نمی نویسم زیرا در حال تولید است میانگین کد برای من، گرفتن کد متوسط ​​و تبدیل آن به کدی که دوست دارم و می‌دانم درست است، بسیار کندتر از نوشتن آن از ابتدا است – حداقل در زبان‌هایی که خوب می‌دانم.»

بنابراین در حالی که واضح است که برنامه نویسی مولد یک عملکرد مرحله ای در بهره وری توسعه دهندگان است، مشخص نیست که این بهبود به طور چشمگیری با آنچه قبلا دیده ایم متفاوت است. هوش مصنوعی مولد برنامه نویسان بهتری می سازد، اما همچنان باید برنامه نویسی کنند.

هوش مصنوعی و تصاویری مولد

از سوی دیگر، تأثیر مدل‌های مولد بر خروجی کار خلاقانه، مانند تولید تصویر، بسیار زیاد است. این منجر به بهبودهای بزرگی در کارایی و هزینه شده است، و سخت است که شاهد تغییر فاز در سطح صنعت نباشیم.

روشی که هوش مصنوعی مولد در این فضا کار می‌کند این است که ورودی‌های متنی ساده را از کاربر دریافت می‌کند که به آنها prompt می‌گویند و سپس مدل یک خروجی بصری تولید می‌کند. در حال حاضر مدل هایی برای ایجاد فرمت های خروجی بسیاری از جمله تصاویر، فیلم ها، مدل های سه بعدی و بافت ها وجود دارد.

آنچه به ویژه جالب است این است که چگونه می توان این مدل ها را برای تولید تصاویر جدید یا خاص دامنه بدون دخالت خلاقانه گسترش داد. به عنوان مثال، گیدو (یکی از نویسندگان) یک مدل تصویر از قبل آموزش دیده را گرفت و دوباره آن را روی چند ده عکس از خودش آموزش داد. از آنجا، او قادر به تولید تصاویر با استفاده از در اعلان در زیر عکس های تولید شده از اعلان های زیر وجود دارد: به عنوان کاپیتان آمریکا"،" در پاریس"،" در یک نقاشی".

هنر نمرده است، فقط هوش داده پلاتو بلاک چین ماشینی است. جستجوی عمودی Ai.
جایی که تولید تصویر یک انحراف گسترده از تولید کد در یک زمینه تجاری است، میزانی است که هوش مصنوعی مولد محاسبات اقتصادی را تغییر می‌دهد. برای ایجاد تصاویر بالا، Guido مدل را بر روی تعدادی عکس با هزینه حدود 50 دلار در منابع زیرساختی آموزش داد.. پس از آموزش، تولید تصاویر حدود 0.001 دلار هزینه دارد در منابع محاسباتی و می تواند در ابر یا در آخرین نسل لپ تاپ. علاوه بر این، تولید تصویر تنها چند ثانیه طول می کشد. 

بدون هوش مصنوعی مولد، تنها راه برای به دست آوردن یک تصویر سفارشی این است که یک هنرمند را استخدام کنید یا خودتان این کار را انجام دهید. حتی اگر با این فرض شروع کنیم که یک فرد می تواند یک تصویر کاملاً سفارشی و واقعی در عرض یک ساعت با قیمت 10 دلار ایجاد کند. رویکرد هوش مصنوعی مولد به راحتی چهار مرتبه ارزانتر و یک مرتبه سریعتر است. واقع بینانه تر، هر اثر هنری سفارشی یا پروژه طراحی گرافیکی احتمالا روزها یا هفته ها طول می کشد و صدها، اگر نه هزاران دلار هزینه خواهد داشت. 

مشابه کمک های برنامه نویسی بالا، هوش مصنوعی مولد نیز خواهد بود به عنوان یک ابزار پذیرفته شده است توسط هنرمندان و هر دو به درجاتی از نظارت کاربر نیاز دارند. اما اغراق کردن تفاوت در اقتصاد که توسط توانایی یک مدل تصویر برای تقلید از خروجی کامل هنرمند ایجاد می شود، دشوار است. با استفاده از یک مدل تولید کد، نوشتن حتی یک برنامه کاربردی بسیار ابتدایی که یک کار محاسباتی استاندارد را انجام می دهد، مستلزم بررسی، ویرایش و افزودن تست برای بسیاری از قطعات کد است. اما برای یک تصویر اولیه، وارد کردن یک اعلان و انتخاب یک تصویر از بین دوجین پیشنهاد را می توان در کمتر از یک دقیقه انجام داد.

به عنوان مثال کاریکاتوریست خودمان (و شریک سرمایه گذاری) یوکو لی (@stuffyokodraws). ما یک مدل را با استفاده از 70 تصویر قبلی او آموزش دادیم و این مدل توانست تصاویری با سطح وهم‌آوری از تقلید تولید کند. هر هنرمندی باید بفهمد که بعداً چه چیزی خلق کند، و حتی متوجه شد که مدل‌های آموزش‌دیده می‌توانند گزینه‌های بیشتری نسبت به آنچه در ذهن خود داشتند به نمایش بگذارند - حداقل زمانی که برای تولید چیزی در یک دوره زمانی معین تحت فشار قرار می‌گیرند. صدها روش برای ترسیم یک شی وجود دارد، اما مدل‌های مولد بلافاصله مشخص کردند که کدام مسیرها ارزش کاوش را دارند. 

بنابراین وقتی نوبت به چنین وظایفی می رسد، ما بحث نمی کنیم که کامپیوترها لزوماً این کار را انجام دهند بهتر نسبت به انسان بر اساس 1:1. اما مانند بسیاری از وظایف دیگر، زمانی که کامپیوترها می توانند خروجی کار کاملی تولید کنند، ما را از بین می برند مقیاس

سعی کنید و حدس بزنید کدام یک از نقاشی های زیر مستقیماً توسط یوکو کشیده شده است و کدام یک ایجاد شده است. 

هنر نمرده است، فقط هوش داده پلاتو بلاک چین ماشینی است. جستجوی عمودی Ai.
پاسخ: مدل هوش مصنوعی تصاویر را با پس زمینه غیر سفید تولید می کند.

بهبود گسترده در اقتصاد، انعطاف پذیری در ایجاد سبک ها و مفاهیم جدید، و توانایی تولید خروجی کار کامل یا تقریبا کامل به ما نشان می دهد که ما آماده مشاهده یک تغییر قابل توجه در تمام صنایعی هستیم که دارایی های خلاقانه یک بخش عمده ای از تجارت و این به تصاویر محدود نمی شود، بلکه در کل زمینه طراحی اعمال می شود. مثلا:

  • هوش مصنوعی مولد می تواند هنر دو بعدی، بافت، مدل های سه بعدی ایجاد کند و به طراحی سطح بازی ها کمک کند. 
  • در بازاریابی، به نظر می رسد که جایگزین هنر استوک، عکاسی محصول و تصویرسازی شود. 
  • ما در حال حاضر شاهد کاربردهایی در طراحی وب، طراحی داخلی و طراحی منظر هستیم.

و ما واقعاً در ابتدای راه هستیم. اگر یک مورد استفاده نیاز به تولید محتوای خلاقانه داشته باشد، به سختی می توان استدلال کرد که چرا هوش مصنوعی مولد آن را مختل نمی کند یا حداقل بخشی از این فرآیند نمی شود.

-

خوب، پس هدف این پست چیست؟ در حالی که تا حدودی بر تولید کد و تولید تصویر متمرکز است، ما مشکوک هستیم که نتایج گسترده‌تر باشد. به ویژه، این تلاش‌های خلاقانه در سراسر جهان - چه بصری، متنی یا موسیقیایی - احتمالاً مدت‌ها قبل از ساخت سیستم‌ها توسط هوش مصنوعی مختل می‌شود. 

علاوه بر استدلال درستی که در بالا استفاده می‌کنیم، ممکن است ترکیب و ترکیب مجدد تمام هنرهای قبلی برای طیف عملی خروجی‌های خلاقانه کافی باشد. برای مثال، صنعت موسیقی و فیلم در طول تاریخ آلبوم‌ها و فیلم‌های پرطرفدار زیادی را تولید کرده‌اند. کاملاً قابل تصور است که مدل‌های مولد می‌توانند به خودکارسازی این عملکردها در طول زمان کمک کنند. با این حال، نکته قابل توجه در مورد بسیاری از تصاویر تولید شده توسط Stable Diffusion و DALL-E 2 این است که آنها واقعا خوب هستند و واقعا جالب. تصور یک مدل هوش مصنوعی که ترکیبات واقعاً جالبی از سبک‌های موسیقی تولید می‌کند یا حتی فیلم‌های بلند بلند «نوشتن» را تولید می‌کند که در نحوه پیوند مفاهیم و سبک‌ها با هم جذاب هستند، دشوار نیست. 

برعکس، تصور اینکه سیستم‌های قبلی حاوی تمام ابزارهایی باشند که برای توسعه همه سیستم‌های آینده نیاز داریم، سخت است. یا حتی سیستم‌های پیچیده را می‌توان به راحتی با سبک‌های مختلف هنری یا موسیقی ترکیب کرد. بنابراین اغلب ارزش یک سیستم، و اینکه چرا ساختن آن‌ها بسیار دشوار است، در ادامه جزئیات است - همه معاوضه‌ها، راه‌حل‌ها، بهینه‌سازی‌ها برای یک فضای طراحی معین، و دانش نهادی/نهفته آنها. بنابراین باید به ساختن ادامه دهیم.

ما در برابر اصرار برای پیش بینی مقاومت خواهیم کرد کاملا چگونه هوش مصنوعی مولد بر صنعت خلاق تأثیر می گذارد. با این حال، تاریخ نشان می دهد که ابزارهای جدید تمایل دارند گسترش به جای قرارداد تعریف هنرو برای انواع جدیدی از هنرمندان قابل دسترسی باشد. در این مورد، هنرمندان جدید سازنده سیستم هستند. بنابراین، برای بنیانگذاران فناوری، ما معتقدیم هوش مصنوعی مولد یک ابزار مثبت است برای گسترش دامنه دسترسی نرم افزارها - بازی ها زیباتر، بازاریابی جذاب تر، محتوای نوشتاری جذاب تر، فیلم ها الهام بخش تر خواهند بود.

چه کسی می داند: یک روز، آرشیو اواخر سال 2022 از اینترنت ممکن است به عنوان یکی از آخرین مخازن محتوای تولید شده توسط انسان در نظر گرفته شود. این متن برای این مقاله، حداقل، به طور کامل توسط انسان تولید شده است. 

هنر نمرده است، فقط هوش داده پلاتو بلاک چین ماشینی است. جستجوی عمودی Ai.
این قطعه توسط تیم infra a16z، با نویسندگان اصلی Guido Appenzeller، Matt Bornstein، Martin Casado، و Yoko Li، و سهم زیادی از سایر اعضای تیم نوشته شده است.

***

نظرات بیان شده در اینجا نظرات پرسنل AH Capital Management, LLC ("a16z") نقل شده است و نظرات a16z یا شرکت های وابسته به آن نیست. برخی از اطلاعات موجود در اینجا از منابع شخص ثالث، از جمله از شرکت‌های سبد سرمایه‌ای که توسط a16z مدیریت می‌شوند، به‌دست آمده است. در حالی که a16z از منابعی گرفته شده است که قابل اعتماد هستند، اما a16z به طور مستقل چنین اطلاعاتی را تأیید نکرده است و هیچ گونه نمایشی در مورد صحت فعلی یا پایدار اطلاعات یا مناسب بودن آن برای یک موقعیت خاص ارائه نمی کند. علاوه بر این، این محتوا ممکن است شامل تبلیغات شخص ثالث باشد. aXNUMXz چنین تبلیغاتی را بررسی نکرده و محتوای تبلیغاتی موجود در آن را تایید نمی کند.

این محتوا فقط برای مقاصد اطلاعاتی ارائه شده است و نباید به عنوان مشاوره حقوقی، تجاری، سرمایه گذاری یا مالیاتی به آن اعتماد کرد. شما باید در مورد این موارد با مشاوران خود مشورت کنید. ارجاع به هر گونه اوراق بهادار یا دارایی دیجیتال فقط برای مقاصد توضیحی است و به منزله توصیه یا پیشنهاد سرمایه گذاری برای ارائه خدمات مشاوره سرمایه گذاری نیست. علاوه بر این، این محتوا برای هیچ سرمایه‌گذار یا سرمایه‌گذار بالقوه‌ای هدایت نشده و برای استفاده از آن در نظر گرفته نشده است، و تحت هیچ شرایطی نمی‌توان هنگام تصمیم‌گیری برای سرمایه‌گذاری در هر صندوقی که توسط a16z مدیریت می‌شود، به آن اعتماد کرد. (پیشنهاد سرمایه گذاری در یک صندوق a16z فقط توسط یادداشت قرار دادن خصوصی، قرارداد اشتراک و سایر اسناد مربوط به هر صندوق انجام می شود و باید به طور کامل خوانده شود.) هر گونه سرمایه گذاری یا شرکت پرتفوی ذکر شده، ارجاع شده، یا شرح داده شده نشان دهنده همه سرمایه گذاری ها در وسایل نقلیه تحت مدیریت a16z نیست، و نمی توان اطمینان داشت که سرمایه گذاری ها سودآور هستند یا سایر سرمایه گذاری های انجام شده در آینده ویژگی ها یا نتایج مشابهی خواهند داشت. فهرستی از سرمایه‌گذاری‌های انجام‌شده توسط صندوق‌های تحت مدیریت آندریسن هوروویتز (به استثنای سرمایه‌گذاری‌هایی که ناشر مجوز افشای عمومی a16z و همچنین سرمایه‌گذاری‌های اعلام‌نشده در دارایی‌های دیجیتالی عمومی را ارائه نکرده است) در https://a16z.com/investments موجود است. /.

نمودارها و نمودارهای ارائه شده در داخل صرفاً برای مقاصد اطلاعاتی هستند و هنگام تصمیم گیری برای سرمایه گذاری نباید به آنها اعتماد کرد. عملکرد گذشته نشان دهنده نتایج آینده نیست. محتوا فقط از تاریخ مشخص شده صحبت می کند. هر گونه پیش بینی، تخمین، پیش بینی، هدف، چشم انداز، و/یا نظرات بیان شده در این مطالب بدون اطلاع قبلی ممکن است تغییر کند و ممکن است متفاوت یا مغایر با نظرات بیان شده توسط دیگران باشد. لطفاً برای اطلاعات مهم بیشتر به https://a16z.com/disclosures مراجعه کنید.

تمبر زمان:

بیشتر از آندرسن هورویتز