چرا مدل های هوش مصنوعی خیلی قبل از اینکه جایگزین برنامه نویسان شوند، جای هنرمندان را خواهند گرفت
شاید جالبترین مفهومی که از هوش مصنوعی مولد میبینیم این باشد که برخلاف دیدگاه رایج که خلاقیت آخرین سنگر نبوغ انسان در مواجهه با اتوماسیون خواهد بود، در واقع به نظر میرسد خیلی راحت تر برای خودکارسازی کارهای خلاقانه نسبتاً دشوار نسبت به خودکارسازی وظایف برنامه نویسی نسبتاً ساده. برای درک این موضوع، دو مورد از محبوبترین موارد استفاده از هوش مصنوعی مولد را مقایسه میکنیم: تولید کد و تولید تصویر. اما ما معتقدیم که این ادعا بهطور کلیتر باقی میماند، حتی زمانی که مدلهای مولد به برنامههای پیچیدهتر گسترش مییابند.
نسخه کوتاه این استدلال (که در زیر با جزئیات بیشتری به آن می پردازیم) این است که اگرچه یک محصول مانند خلبان GitHubدر شکل فعلی خود، می تواند کدنویسی را تا حدودی کارآمدتر کند، نیازی به توسعه دهندگان نرم افزار توانمند با دانش برنامه نویسی را برطرف نمی کند. یک دلیل بزرگ این است که وقتی نوبت به ساختن یک برنامه می رسد، درستی واقعا مهم است. اگر هوش مصنوعی برنامه ای را تولید کند، باز هم به انسان نیاز دارد تا درستی آن را تأیید کند - تلاشی تقریباً در همان سطحی که برای شروع آن ایجاد شد.
از طرف دیگر، هر کسی که می تواند تایپ کند می تواند از یک مدل مانند استفاده کند انتشار پایدار برای تولید تصاویر با کیفیت بالا و منحصر به فرد در عرض چند دقیقه، با چندین مرتبه بزرگی و هزینه کمتر. محصولات کار خلاق اغلب محدودیت های صحت دقیق ندارند و خروجی های مدل ها به طرز خیره کننده ای کامل هستند. سخت است که شاهد تغییر فاز کامل در صنایعی نباشیم که به تصاویر خلاقانه متکی هستند، زیرا برای بسیاری از کاربردها، تصاویری که هوش مصنوعی در حال حاضر قادر به تولید آن است کافی است و ما هنوز در مراحل اولیه این فناوری هستیم.
ما کاملاً اذعان داریم که سخت است به هر پیشبینی با سرعتی که میدان در حال حرکت است مطمئن بود. با این حال، در حال حاضر، به نظر میرسد که ما بیشتر احتمال دارد که برنامههایی پر از تصاویر خلاقانه را ببینیم که صرفاً توسط برنامهنویسان ایجاد شدهاند تا برنامههایی با هنر طراحی شده توسط انسان که صرفاً توسط سازندگان ساخته شدهاند.
چرا هیاهو و چرا الان؟
قبل از اینکه بخواهیم به ویژگیهای تولید کد در مقابل تولید تصویر بپردازیم، درک این موضوع که هوش مصنوعی به طور کلی و به طور خاص هوش مصنوعی مولد در حال حاضر چقدر محبوب هستند مفید است.
هوش مصنوعی مولد سریعترین جذب را توسط توسعهدهندگانی که تاکنون دیدهایم مشاهده میکند. همانطور که ما این مقاله را می نویسیم، Stable Diffusion به راحتی با اختلاف زیادی در صدر نمودارهای ترند مخازن GitHub قرار می گیرد.. رشد آن بسیار جلوتر از هر فناوری اخیر در زیرساخت یا رمزارز است (شکل بالا را ببینید). تقریباً روزانه اعلامیههای راهاندازی و تأمین مالی استارتآپهایی که از این فناوری استفاده میکنند وجود دارد، و شبکههای اجتماعی آنلاین مملو از محتوای ایجاد شده توسط مدلهای مولد هستند.
سطح کلی سرمایه گذاری در هوش مصنوعی در دهه گذشته نیز به سختی قابل اغراق است. ما از اواسط دهه 2010 به تنهایی شاهد افزایش تصاعدی در انتشارات بوده ایم (شکل زیر را ببینید). امروزه، حدود 20 درصد از تمام مقالات ارسال شده در arXiv در مورد AI، ML و NLP هستند. نکته مهم این است که نتایج نظری از آستانه بحرانی عبور کرده است، جایی که به راحتی قابل مصرف شده است و باعث انفجار کامبرین از تکنیک ها، نرم افزارها و استارت آپ های جدید شده است.
جدیدترین افزایش در شکل بالا عمدتاً به دلیل هوش مصنوعی مولد است. در یک دهه، ما از مدلهای هوش مصنوعی متخصص که میتوانستند تصاویر را طبقهبندی کنند و جاسازیهای کلمه ایجاد کنند، به مدلهای قابل استفاده عمومی که میتوانند کد مؤثر بنویسند و تصاویر بسیار دقیقی را با استفاده از اعلانهای زبان طبیعی ایجاد کنند، تغییر کردهایم. جای تعجب نیست که سرعت نوآوری فقط افزایش یافته است، و زمانی که مدل های مولد شروع به هجوم به مناطق دیگری می کنند که زمانی تحت سلطه انسان ها بود، جای تعجب نیست.
هوش مصنوعی و برنامه نویسی مولد
یکی از اولین کاربردهای هوش مصنوعی مولد کمک برنامه نویس بوده است. روش کار به این صورت است که یک مدل بر روی مجموعه بزرگی از کد آموزش داده می شود (مثلاً تمام مخازن عمومی در GitHub) و سپس در حین کدنویسی به برنامه نویس پیشنهاد می دهد. نتایج فوق العاده است. تا آنجا که منطقی است این رویکرد مترادف با برنامه نویسی در آینده خواهد شد.
با این حال، افزایش بهره وری نسبت به تولید تصویر، که در زیر به آن می پردازیم، اندک بوده است. بخشی از دلیل این امر، همانطور که در بالا ذکر شد، این است که صحت در برنامه نویسی بسیار مهم است (و در واقع مشکلات مهندسی به طور گسترده تر، اما ما در این پست بر برنامه نویسی تمرکز می کنیم). مثلا، یک مطالعه اخیر یافت شده است که برای سناریوهای مطابق با ریسک بالا CWE (شمارههای ضعف رایج)40 درصد کدهای تولید شده توسط هوش مصنوعی دارای آسیبپذیری هستند.
بنابراین، کاربر باید تعادلی بین تولید کد کافی برای افزایش بهرهوری معنادار ایجاد کند، در حالی که همچنان آن را محدود میکند تا امکان بررسی صحت وجود داشته باشد. در نتیجه، Copilot دارد کمک کرد بهبود بهره وری توسعه دهندگان - مطالعات اخیر (اینجا کلیک نمایید و اینجا کلیک نمایید) سودها را در حد 2 برابر یا کمتر قرار دهید - اما به سطحی همتراز با آنچه در پیشرفت های قبلی زبان های توسعه دهنده و ابزارها دیده ایم. برای مثال، جهش از مونتاژ به C، بر اساس برخی برآوردها، بهره وری را 2 تا 5 برابر بهبود بخشید.
برای برنامه نویسان با تجربه تر، نگرانی ها ممکن است فراتر از صحت کد و کیفیت کلی کد گسترش یابد. مانند سریع .aiجرمی هاوارد توضیح داده است با توجه به نسخه های اخیر مدل OpenAI Codex، "[من] کد مفصل نمی نویسم زیرا در حال تولید است میانگین کد برای من، گرفتن کد متوسط و تبدیل آن به کدی که دوست دارم و میدانم درست است، بسیار کندتر از نوشتن آن از ابتدا است – حداقل در زبانهایی که خوب میدانم.»
بنابراین در حالی که واضح است که برنامه نویسی مولد یک عملکرد مرحله ای در بهره وری توسعه دهندگان است، مشخص نیست که این بهبود به طور چشمگیری با آنچه قبلا دیده ایم متفاوت است. هوش مصنوعی مولد برنامه نویسان بهتری می سازد، اما همچنان باید برنامه نویسی کنند.
هوش مصنوعی و تصاویری مولد
از سوی دیگر، تأثیر مدلهای مولد بر خروجی کار خلاقانه، مانند تولید تصویر، بسیار زیاد است. این منجر به بهبودهای بزرگی در کارایی و هزینه شده است، و سخت است که شاهد تغییر فاز در سطح صنعت نباشیم.
روشی که هوش مصنوعی مولد در این فضا کار میکند این است که ورودیهای متنی ساده را از کاربر دریافت میکند که به آنها prompt میگویند و سپس مدل یک خروجی بصری تولید میکند. در حال حاضر مدل هایی برای ایجاد فرمت های خروجی بسیاری از جمله تصاویر، فیلم ها، مدل های سه بعدی و بافت ها وجود دارد.
آنچه به ویژه جالب است این است که چگونه می توان این مدل ها را برای تولید تصاویر جدید یا خاص دامنه بدون دخالت خلاقانه گسترش داد. به عنوان مثال، گیدو (یکی از نویسندگان) یک مدل تصویر از قبل آموزش دیده را گرفت و دوباره آن را روی چند ده عکس از خودش آموزش داد. از آنجا، او قادر به تولید تصاویر با استفاده از در اعلان در زیر عکس های تولید شده از اعلان های زیر وجود دارد: به عنوان کاپیتان آمریکا"،" در پاریس"،" در یک نقاشی".
جایی که تولید تصویر یک انحراف گسترده از تولید کد در یک زمینه تجاری است، میزانی است که هوش مصنوعی مولد محاسبات اقتصادی را تغییر میدهد. برای ایجاد تصاویر بالا، Guido مدل را بر روی تعدادی عکس با هزینه حدود 50 دلار در منابع زیرساختی آموزش داد.. پس از آموزش، تولید تصاویر حدود 0.001 دلار هزینه دارد در منابع محاسباتی و می تواند در ابر یا در آخرین نسل لپ تاپ. علاوه بر این، تولید تصویر تنها چند ثانیه طول می کشد.
بدون هوش مصنوعی مولد، تنها راه برای به دست آوردن یک تصویر سفارشی این است که یک هنرمند را استخدام کنید یا خودتان این کار را انجام دهید. حتی اگر با این فرض شروع کنیم که یک فرد می تواند یک تصویر کاملاً سفارشی و واقعی در عرض یک ساعت با قیمت 10 دلار ایجاد کند. رویکرد هوش مصنوعی مولد به راحتی چهار مرتبه ارزانتر و یک مرتبه سریعتر است. واقع بینانه تر، هر اثر هنری سفارشی یا پروژه طراحی گرافیکی احتمالا روزها یا هفته ها طول می کشد و صدها، اگر نه هزاران دلار هزینه خواهد داشت.
مشابه کمک های برنامه نویسی بالا، هوش مصنوعی مولد نیز خواهد بود به عنوان یک ابزار پذیرفته شده است توسط هنرمندان و هر دو به درجاتی از نظارت کاربر نیاز دارند. اما اغراق کردن تفاوت در اقتصاد که توسط توانایی یک مدل تصویر برای تقلید از خروجی کامل هنرمند ایجاد می شود، دشوار است. با استفاده از یک مدل تولید کد، نوشتن حتی یک برنامه کاربردی بسیار ابتدایی که یک کار محاسباتی استاندارد را انجام می دهد، مستلزم بررسی، ویرایش و افزودن تست برای بسیاری از قطعات کد است. اما برای یک تصویر اولیه، وارد کردن یک اعلان و انتخاب یک تصویر از بین دوجین پیشنهاد را می توان در کمتر از یک دقیقه انجام داد.
به عنوان مثال کاریکاتوریست خودمان (و شریک سرمایه گذاری) یوکو لی (@stuffyokodraws). ما یک مدل را با استفاده از 70 تصویر قبلی او آموزش دادیم و این مدل توانست تصاویری با سطح وهمآوری از تقلید تولید کند. هر هنرمندی باید بفهمد که بعداً چه چیزی خلق کند، و حتی متوجه شد که مدلهای آموزشدیده میتوانند گزینههای بیشتری نسبت به آنچه در ذهن خود داشتند به نمایش بگذارند - حداقل زمانی که برای تولید چیزی در یک دوره زمانی معین تحت فشار قرار میگیرند. صدها روش برای ترسیم یک شی وجود دارد، اما مدلهای مولد بلافاصله مشخص کردند که کدام مسیرها ارزش کاوش را دارند.
بنابراین وقتی نوبت به چنین وظایفی می رسد، ما بحث نمی کنیم که کامپیوترها لزوماً این کار را انجام دهند بهتر نسبت به انسان بر اساس 1:1. اما مانند بسیاری از وظایف دیگر، زمانی که کامپیوترها می توانند خروجی کار کاملی تولید کنند، ما را از بین می برند مقیاس.
سعی کنید و حدس بزنید کدام یک از نقاشی های زیر مستقیماً توسط یوکو کشیده شده است و کدام یک ایجاد شده است.
بهبود گسترده در اقتصاد، انعطاف پذیری در ایجاد سبک ها و مفاهیم جدید، و توانایی تولید خروجی کار کامل یا تقریبا کامل به ما نشان می دهد که ما آماده مشاهده یک تغییر قابل توجه در تمام صنایعی هستیم که دارایی های خلاقانه یک بخش عمده ای از تجارت و این به تصاویر محدود نمی شود، بلکه در کل زمینه طراحی اعمال می شود. مثلا:
- هوش مصنوعی مولد می تواند هنر دو بعدی، بافت، مدل های سه بعدی ایجاد کند و به طراحی سطح بازی ها کمک کند.
- در بازاریابی، به نظر می رسد که جایگزین هنر استوک، عکاسی محصول و تصویرسازی شود.
- ما در حال حاضر شاهد کاربردهایی در طراحی وب، طراحی داخلی و طراحی منظر هستیم.
و ما واقعاً در ابتدای راه هستیم. اگر یک مورد استفاده نیاز به تولید محتوای خلاقانه داشته باشد، به سختی می توان استدلال کرد که چرا هوش مصنوعی مولد آن را مختل نمی کند یا حداقل بخشی از این فرآیند نمی شود.
-
خوب، پس هدف این پست چیست؟ در حالی که تا حدودی بر تولید کد و تولید تصویر متمرکز است، ما مشکوک هستیم که نتایج گستردهتر باشد. به ویژه، این تلاشهای خلاقانه در سراسر جهان - چه بصری، متنی یا موسیقیایی - احتمالاً مدتها قبل از ساخت سیستمها توسط هوش مصنوعی مختل میشود.
علاوه بر استدلال درستی که در بالا استفاده میکنیم، ممکن است ترکیب و ترکیب مجدد تمام هنرهای قبلی برای طیف عملی خروجیهای خلاقانه کافی باشد. برای مثال، صنعت موسیقی و فیلم در طول تاریخ آلبومها و فیلمهای پرطرفدار زیادی را تولید کردهاند. کاملاً قابل تصور است که مدلهای مولد میتوانند به خودکارسازی این عملکردها در طول زمان کمک کنند. با این حال، نکته قابل توجه در مورد بسیاری از تصاویر تولید شده توسط Stable Diffusion و DALL-E 2 این است که آنها واقعا خوب هستند و واقعا جالب. تصور یک مدل هوش مصنوعی که ترکیبات واقعاً جالبی از سبکهای موسیقی تولید میکند یا حتی فیلمهای بلند بلند «نوشتن» را تولید میکند که در نحوه پیوند مفاهیم و سبکها با هم جذاب هستند، دشوار نیست.
برعکس، تصور اینکه سیستمهای قبلی حاوی تمام ابزارهایی باشند که برای توسعه همه سیستمهای آینده نیاز داریم، سخت است. یا حتی سیستمهای پیچیده را میتوان به راحتی با سبکهای مختلف هنری یا موسیقی ترکیب کرد. بنابراین اغلب ارزش یک سیستم، و اینکه چرا ساختن آنها بسیار دشوار است، در ادامه جزئیات است - همه معاوضهها، راهحلها، بهینهسازیها برای یک فضای طراحی معین، و دانش نهادی/نهفته آنها. بنابراین باید به ساختن ادامه دهیم.
ما در برابر اصرار برای پیش بینی مقاومت خواهیم کرد کاملا چگونه هوش مصنوعی مولد بر صنعت خلاق تأثیر می گذارد. با این حال، تاریخ نشان می دهد که ابزارهای جدید تمایل دارند گسترش به جای قرارداد تعریف هنرو برای انواع جدیدی از هنرمندان قابل دسترسی باشد. در این مورد، هنرمندان جدید سازنده سیستم هستند. بنابراین، برای بنیانگذاران فناوری، ما معتقدیم هوش مصنوعی مولد یک ابزار مثبت است برای گسترش دامنه دسترسی نرم افزارها - بازی ها زیباتر، بازاریابی جذاب تر، محتوای نوشتاری جذاب تر، فیلم ها الهام بخش تر خواهند بود.
چه کسی می داند: یک روز، آرشیو اواخر سال 2022 از اینترنت ممکن است به عنوان یکی از آخرین مخازن محتوای تولید شده توسط انسان در نظر گرفته شود. این متن برای این مقاله، حداقل، به طور کامل توسط انسان تولید شده است.
***
نظرات بیان شده در اینجا نظرات پرسنل AH Capital Management, LLC ("a16z") نقل شده است و نظرات a16z یا شرکت های وابسته به آن نیست. برخی از اطلاعات موجود در اینجا از منابع شخص ثالث، از جمله از شرکتهای سبد سرمایهای که توسط a16z مدیریت میشوند، بهدست آمده است. در حالی که a16z از منابعی گرفته شده است که قابل اعتماد هستند، اما a16z به طور مستقل چنین اطلاعاتی را تأیید نکرده است و هیچ گونه نمایشی در مورد صحت فعلی یا پایدار اطلاعات یا مناسب بودن آن برای یک موقعیت خاص ارائه نمی کند. علاوه بر این، این محتوا ممکن است شامل تبلیغات شخص ثالث باشد. aXNUMXz چنین تبلیغاتی را بررسی نکرده و محتوای تبلیغاتی موجود در آن را تایید نمی کند.
این محتوا فقط برای مقاصد اطلاعاتی ارائه شده است و نباید به عنوان مشاوره حقوقی، تجاری، سرمایه گذاری یا مالیاتی به آن اعتماد کرد. شما باید در مورد این موارد با مشاوران خود مشورت کنید. ارجاع به هر گونه اوراق بهادار یا دارایی دیجیتال فقط برای مقاصد توضیحی است و به منزله توصیه یا پیشنهاد سرمایه گذاری برای ارائه خدمات مشاوره سرمایه گذاری نیست. علاوه بر این، این محتوا برای هیچ سرمایهگذار یا سرمایهگذار بالقوهای هدایت نشده و برای استفاده از آن در نظر گرفته نشده است، و تحت هیچ شرایطی نمیتوان هنگام تصمیمگیری برای سرمایهگذاری در هر صندوقی که توسط a16z مدیریت میشود، به آن اعتماد کرد. (پیشنهاد سرمایه گذاری در یک صندوق a16z فقط توسط یادداشت قرار دادن خصوصی، قرارداد اشتراک و سایر اسناد مربوط به هر صندوق انجام می شود و باید به طور کامل خوانده شود.) هر گونه سرمایه گذاری یا شرکت پرتفوی ذکر شده، ارجاع شده، یا شرح داده شده نشان دهنده همه سرمایه گذاری ها در وسایل نقلیه تحت مدیریت a16z نیست، و نمی توان اطمینان داشت که سرمایه گذاری ها سودآور هستند یا سایر سرمایه گذاری های انجام شده در آینده ویژگی ها یا نتایج مشابهی خواهند داشت. فهرستی از سرمایهگذاریهای انجامشده توسط صندوقهای تحت مدیریت آندریسن هوروویتز (به استثنای سرمایهگذاریهایی که ناشر مجوز افشای عمومی a16z و همچنین سرمایهگذاریهای اعلامنشده در داراییهای دیجیتالی عمومی را ارائه نکرده است) در https://a16z.com/investments موجود است. /.
نمودارها و نمودارهای ارائه شده در داخل صرفاً برای مقاصد اطلاعاتی هستند و هنگام تصمیم گیری برای سرمایه گذاری نباید به آنها اعتماد کرد. عملکرد گذشته نشان دهنده نتایج آینده نیست. محتوا فقط از تاریخ مشخص شده صحبت می کند. هر گونه پیش بینی، تخمین، پیش بینی، هدف، چشم انداز، و/یا نظرات بیان شده در این مطالب بدون اطلاع قبلی ممکن است تغییر کند و ممکن است متفاوت یا مغایر با نظرات بیان شده توسط دیگران باشد. لطفاً برای اطلاعات مهم بیشتر به https://a16z.com/disclosures مراجعه کنید.
- هوش مصنوعی، ماشین و یادگیری عمیق
- آندرسن هورویتز
- بیت کوین
- بلاکچین
- انطباق با بلاک چین
- کنفرانس بلاکچین
- coinbase
- coingenius
- اجماع
- کنفرانس رمزنگاری
- معدنکاری رمز گشایی
- کریپتو کارنسی (رمز ارزها )
- غیر متمرکز
- DEFI
- دارایی های دیجیتال
- ethereum
- هوش مصنوعی مولد
- فراگیری ماشین
- رمز غیر قابل شستشو
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- پلاتوبلاک چین
- PlatoData
- بازی پلاتو
- چند ضلعی
- اثبات سهام
- W3
- زفیرنت