الفن ليس ميتًا ، إنه مجرد ذكاء بيانات PlatoBlockchain المولدة آليًا. البحث العمودي. عاي.

الفن ليس ميتًا ، إنه مجرد آلة مولدة

لماذا ستحل نماذج الذكاء الاصطناعي محل الفنانين قبل فترة طويلة من استبدال المبرمجين

ربما يكون التأثير الضمني الأكثر إثارة للانحراف الذي نراه من الذكاء الاصطناعي التوليدي هو أنه ، على عكس الرأي الشائع القائل بأن الإبداع سيكون آخر معقل للإبداع البشري في مواجهة الأتمتة ، يبدو أنه كذلك اسهل بكثير لأتمتة المهام الإبداعية الصعبة بدلاً من أتمتة مهام البرمجة البسيطة نسبيًا. لفهم هذا ، نقارن بين حالتين من حالات الاستخدام الأكثر شيوعًا للذكاء الاصطناعي التوليدي: إنشاء الكود وتوليد الصور. لكننا نعتقد أن هذا الادعاء يصمد بشكل عام ، حتى مع توسع النماذج التوليدية في تطبيقات أكثر تعقيدًا.

النسخة القصيرة من الحجة (التي نتناولها بمزيد من التفصيل أدناه) هي أنه على الرغم من أن منتجًا مثل مساعد الطيار جيثب، في شكله الحالي ، يمكن أن يجعل الترميز أكثر كفاءة إلى حد ما ، فهو لا يغني عن الحاجة إلى مطوري برمجيات مؤهلين لديهم معرفة برمجية. أحد الأسباب الرئيسية هو أنه عندما يتعلق الأمر ببناء برنامج ، فإن الصواب مهم حقًا. إذا قام الذكاء الاصطناعي بإنشاء برنامج ، فإنه لا يزال يتطلب من الإنسان التحقق من صحته - جهد على نفس مستوى إنشائه للبدء به.

من ناحية أخرى ، يمكن لأي شخص يمكنه الكتابة استخدام نموذج مثل انتشار مستقر لإنتاج صور فريدة من نوعها عالية الجودة في دقائق وبتكلفة أقل بكثير. غالبًا ما لا تحتوي منتجات العمل الإبداعي على قيود صارمة على الصحة ، وتكون مخرجات النماذج كاملة بشكل مذهل. من الصعب عدم رؤية تحول كامل في الطور في الصناعات التي تعتمد على المرئيات الإبداعية لأنه ، بالنسبة للعديد من الاستخدامات ، فإن المرئيات التي يستطيع الذكاء الاصطناعي إنتاجها الآن كافية بالفعل ، وما زلنا في بدايات هذه التقنية.

نحن ندرك تمامًا أنه من الصعب أن تكون واثقًا من أي تنبؤات بالوتيرة التي يتحرك بها المجال. في الوقت الحالي ، على الرغم من ذلك ، يبدو أنه من المرجح أن نرى تطبيقات مليئة بالصور الإبداعية التي تم إنشاؤها بدقة من قبل المبرمجين أكثر من التطبيقات ذات الفن المصمم بواسطة الإنسان والذي تم إنشاؤه بدقة بواسطة المبدعين. 

لماذا هذا الضجيج ولماذا الآن؟

قبل أن ندخل في تفاصيل إنشاء الكود مقابل إنشاء الصور ، من المفيد التعرف على مدى شعبية الذكاء الاصطناعي بشكل عام والذكاء الاصطناعي التوليدي ، على وجه التحديد ، في الوقت الحالي.

يشهد الذكاء الاصطناعي التوليدي أسرع استيعاب للمطورين رأيناه على الإطلاق. أثناء كتابة هذا ، يتصدر Stable Diffusion بسهولة المخططات الشائعة لمستودعات GitHub بهامش واسع. نموها يسبق بكثير أي تقنية حديثة في البنية التحتية أو التشفير (انظر الشكل أعلاه). هناك إعلانات إطلاق وتمويل شبه يومية للشركات الناشئة التي تستخدم التكنولوجيا ، وتغمر الشبكات الاجتماعية عبر الإنترنت بالمحتوى الذي تم إنشاؤه بواسطة النماذج التوليدية.

من الصعب أيضًا المبالغة في المستوى الإجمالي للاستثمار في الذكاء الاصطناعي خلال العقد الماضي. لقد شهدنا زيادة هائلة في المنشورات وحدها منذ منتصف عام 2010 (انظر الشكل أدناه). اليوم ، حوالي 20٪ من جميع المقالات المنشورة على arXiv تدور حول AI و ML و NLP. الأهم من ذلك ، أن النتائج النظرية قد تجاوزت عتبة حرجة حيث أصبحت قابلة للاستهلاك بسهولة وأدت إلى انفجار كامبري للتقنيات والبرامج والشركات الناشئة الجديدة. 

الفن ليس ميتًا ، إنه مجرد ذكاء بيانات PlatoBlockchain المولدة آليًا. البحث العمودي. عاي.

أحدث ارتفاع في الشكل أعلاه يرجع إلى حد كبير إلى الذكاء الاصطناعي التوليدي. في عقد واحد ، انتقلنا من نماذج ذكاء اصطناعي للخبراء فقط يمكنها تصنيف الصور وإنشاء تضمين كلمات إلى نماذج قابلة للاستخدام بشكل عام يمكنها كتابة تعليمات برمجية فعالة وإنشاء صور دقيقة بشكل ملحوظ باستخدام مطالبات اللغة الطبيعية. ليس من المستغرب أن تسارع وتيرة الابتكار فقط ، ولا ينبغي أن يكون مفاجئًا عندما تبدأ النماذج التوليدية في اختراق مجالات أخرى كان البشر يسيطرون عليها ذات يوم.

الذكاء الاصطناعي التوليدي والبرمجة

كان أحد أقدم استخدامات الذكاء الاصطناعي التوليدي بمثابة مساعدة للمبرمج. الطريقة التي يعمل بها هي أن النموذج يتم تدريبه على مجموعة كبيرة من التعليمات البرمجية (على سبيل المثال ، جميع المستودعات العامة في GitHub) ثم يقدم اقتراحًا للمبرمج أثناء قيامه بالتشفير. كانت النتائج رائعة. لدرجة أنه من المعقول أن يصبح هذا النهج مرادفًا للبرمجة في المستقبل.

الفن ليس ميتًا ، إنه مجرد ذكاء بيانات PlatoBlockchain المولدة آليًا. البحث العمودي. عاي.
رمز مُنشأ: آمن ضد الهجمات التي لا تستخدم الفواصل المنقوطة.

ومع ذلك ، كانت مكاسب الإنتاجية متواضعة مقارنة بتوليد الصور ، والتي نغطيها أدناه. جزء من سبب ذلك ، كما ذكر أعلاه ، هو أن الصواب أمر بالغ الأهمية في البرمجة (وفي الواقع هندسة المشكلات على نطاق أوسع ، لكننا نركز على البرمجة في هذا المنشور). فمثلا، وجدت دراسة حديثة هذا لسيناريوهات مطابقة عالية المخاطر CWEs (تعدادات الضعف الشائعة)، 40٪ من التعليمات البرمجية التي تم إنشاؤها بواسطة الذكاء الاصطناعي تحتوي على ثغرات أمنية.

وبالتالي ، يتعين على المستخدم تحقيق توازن بين إنشاء رمز كافٍ لتوفير زيادة إنتاجية ذات مغزى ، مع الاستمرار في تقييده حتى يتسنى التحقق من صحته. نتيجة لذلك ، يمتلك مساعد الطيار ساعد تحسين إنتاجية المطور - الدراسات الحديثة (هنا و هنا) ضع المكاسب بترتيب 2x أو أقل - ولكن إلى مستوى مماثل لما رأيناه في التطورات السابقة للغات وأدوات المطورين. القفزة من التجميع إلى C ، على سبيل المثال ، حسنت الإنتاجية 2-5x من خلال بعض التقديرات.

بالنسبة للمبرمجين الأكثر خبرة ، قد تمتد المخاوف إلى ما هو أبعد من صحة الشفرة وإلى جودة الكود بشكل عام. كما سريعجيريمي هوارد قد أوضح فيما يتعلق بالإصدارات الأخيرة من نموذج OpenAI Codex ، "[أنا] تكتب رمزًا مطولًا لأنها تولد المتوسط الشفرة. بالنسبة لي ، فإن تحويل الكود المتوسط ​​إلى رمز أحبه وأعلم أنه صحيح هو أبطأ بكثير من مجرد كتابته من الصفر - على الأقل في اللغات التي أعرفها جيدًا ".

لذا ، في حين أنه من الواضح أن البرمجة التوليدية هي وظيفة خطوة في إنتاجية المطور ، فليس من الواضح أن التحسين يختلف اختلافًا كبيرًا عن تلك التي رأيناها من قبل. الذكاء الاصطناعي التوليدي يصنع مبرمجين أفضل ، لكن لا يزال يتعين عليهم البرمجة.

الذكاء الاصطناعي والمرئيات التوليدية

من ناحية أخرى ، فإن تأثير النماذج التوليدية على مخرجات العمل الإبداعي ، مثل توليد الصور ، شديد للغاية. لقد أدى ذلك إلى العديد من التحسينات الضخمة في الكفاءة والتكلفة ، ومن الصعب عدم رؤيتها تستهل تحولًا في المرحلة على مستوى الصناعة.

الطريقة التي يعمل بها الذكاء الاصطناعي التوليدي في هذا الفضاء هي أخذ مدخلات نصية بسيطة من المستخدم ، تسمى المطالبات ، ثم يولد النموذج مخرجات مرئية. توجد حاليًا نماذج لإنشاء العديد من تنسيقات الإخراج ، بما في ذلك الصور ومقاطع الفيديو والنماذج ثلاثية الأبعاد والقوام.

الأمر المثير للاهتمام بشكل خاص هو كيف يمكن توسيع هذه النماذج لإنشاء صور جديدة أو خاصة بمجال معين دون أي تدخل إبداعي تقريبًا. على سبيل المثال ، أخذ Guido (أحد المؤلفين) نموذجًا للصورة مُدرَّبًا مسبقًا وأعاد تدريبه على بضع عشرات من الصور لنفسه. من هناك ، كان قادرًا على إنشاء الصور باستخدام في موجه. فيما يلي الصور التي تم إنشاؤها من المطالبات التالية: " ككابتن أمريكا"،" في باريس"،" في لوحة".

الفن ليس ميتًا ، إنه مجرد ذكاء بيانات PlatoBlockchain المولدة آليًا. البحث العمودي. عاي.
عندما يكون إنشاء الصور خروجًا كبيرًا عن إنشاء الكود في سياق الأعمال التجارية ، فإن المدى الذي يغير فيه الذكاء الاصطناعي التوليدي الحسابات الاقتصادية. لإنشاء الصور أعلاه ، قام Guido بتدريب النموذج على عدد قليل من الصور بتكلفة حوالي 50 دولارًا أمريكيًا في موارد البنية التحتية. بمجرد التدريب ، يكلف إنشاء الصور حوالي 0.001 دولار في موارد الحوسبة ويمكن إجراؤها في السحابة أو على كمبيوتر محمول من الجيل الأحدث. علاوة على ذلك ، يستغرق إنشاء الصورة بضع ثوانٍ فقط. 

بدون الذكاء الاصطناعي التوليدي ، فإن الطريقة الوحيدة للحصول على صورة مخصصة هي إما توظيف فنان أو القيام بذلك بنفسك. حتى لو بدأنا بافتراض أن الشخص يمكنه إنشاء صورة واقعية مخصصة تمامًا في غضون ساعة واحدة مقابل 10 دولارات ، يعتبر نهج الذكاء الاصطناعي التوليدي أرخص بأربع مراتب وأسرع من حيث الحجم. بشكل أكثر واقعية ، من المرجح أن يستغرق أي عمل فني مخصص أو مشروع تصميم رسومي أيامًا أو أسابيع ، وسيكلف مئات ، إن لم يكن الآلاف ، من الدولارات. 

على غرار مساعدات البرمجة أعلاه ، سيكون الذكاء الاصطناعي التوليدي المعتمدة كأداة من قبل الفنانين وكلاهما يتطلب درجة معينة من إشراف المستخدم. لكن من الصعب المبالغة في تقدير الاختلاف في الاقتصاد الناتج عن قدرة نموذج الصورة على محاكاة إخراج الفنان بالكامل. باستخدام نموذج إنشاء التعليمات البرمجية ، تتطلب كتابة حتى برنامج وظيفي أساسي جدًا يؤدي مهمة حوسبة قياسية مراجعة وتحرير وإضافة اختبارات للعديد من مقتطفات التعليمات البرمجية. ولكن بالنسبة للصورة الأساسية ، يمكن إدخال مطالبة واختيار صورة من عشرات الاقتراحات في أقل من دقيقة.

خذ على سبيل المثال رسام الكاريكاتير الخاص بنا (وشريكنا الاستثماري) يوكو لي (تضمين التغريدة). قمنا بتدريب نموذج باستخدام 70 صورة من صورها السابقة ، وكان النموذج قادرًا على إنشاء صور بمستوى مخيف من التقليد. يجب على كل فنان أن يكتشف ما سيبتكره بعد ذلك ، حتى أنها وجدت أن النماذج المدربة يمكنها عرض المزيد من الخيارات أكثر مما كان يدور في أذهانهم - على الأقل عند الضغط عليهم لإنتاج شيء ما في فترة زمنية معينة. هناك مئات الطرق لرسم نفس الشيء ، لكن النماذج التوليدية أوضحت على الفور المسارات التي تستحق الاستكشاف. 

لذلك عندما يتعلق الأمر بمثل هذه المهام ، فإننا لا نجادل بالضرورة في أن أجهزة الكمبيوتر أفضل من البشر على أساس 1: 1. ولكن كما هو الحال مع العديد من المهام الأخرى ، عندما تتمكن أجهزة الكمبيوتر من إنتاج مخرجات عمل كاملة ، فإنها تقتلنا مقياس

جرب وتخمين أي من الرسومات أدناه تم رسمها مباشرة بواسطة Yoko وأيها تم إنشاؤه. 

الفن ليس ميتًا ، إنه مجرد ذكاء بيانات PlatoBlockchain المولدة آليًا. البحث العمودي. عاي.
الإجابة: قام نموذج AI بإنشاء الصور بخلفية غير بيضاء.

إن التحسن الهائل في الاقتصاد ، والمرونة في القدرة على صياغة أنماط ومفاهيم جديدة ، والقدرة على إنشاء مخرجات عمل كاملة أو شبه كاملة تشير إلينا أننا على استعداد لرؤية تغيير ملحوظ في جميع الصناعات حيث تكون الأصول الإبداعية جزء كبير من العمل. وهذا لا يقتصر على الصور ، بل ينطبق على مجال التصميم بأكمله. فمثلا:

  • يمكن للذكاء الاصطناعي التوليدي إنشاء فن ثنائي الأبعاد ، ومواد ، ونماذج ثلاثية الأبعاد ، والمساعدة في تصميم المستوى للألعاب. 
  • في التسويق ، يبدو أنه مهيأ لاستبدال فن المخزون ، والتصوير الفوتوغرافي للمنتج ، والتوضيح. 
  • نشهد بالفعل تطبيقات في تصميم الويب والتصميم الداخلي وتصميم المناظر الطبيعية.

ونحن حقًا في البداية. إذا كانت حالة الاستخدام تتطلب إنشاء محتوى إبداعي ، فمن الصعب أن ترى الحجة لماذا لن يؤدي الذكاء الاصطناعي التوليدي إلى تعطيله أو على الأقل أن يصبح جزءًا من العملية.

-

حسنًا ، ما هو الهدف من هذا المنشور؟ في حين أنه يركز إلى حد ما بشكل ضيق على إنشاء الكود وتوليد الصور ، فإننا نشك في أن النتائج تنطبق على نطاق أوسع. على وجه الخصوص ، من المحتمل أن تتعطل تلك المساعي الإبداعية في جميع المجالات - سواء كانت مرئية أو نصية أو موسيقية - بواسطة الذكاء الاصطناعي قبل وقت طويل من بناء الأنظمة. 

بالإضافة إلى حجة الصواب التي استخدمناها أعلاه ، قد يكون الأمر كذلك أن الجمع بين جميع الأعمال الفنية السابقة وإعادة توحيدها قد يكون كافياً للنطاق العملي للمخرجات الإبداعية. على سبيل المثال ، أنتجت صناعات الموسيقى والأفلام تاريخياً عددًا لا يحصى من الألبومات والأفلام المشهورة. من المتصور تمامًا أن النماذج التوليدية يمكن أن تساعد في أتمتة هذه الوظائف بمرور الوقت. ومع ذلك ، فإن الشيء الرائع في الكثير من الصور التي تم إنتاجها بواسطة Stable Diffusion و DALL-E 2 هو ذلك إنهم جيدون حقًا و حقا مثيرة للاهتمام. ليس من الصعب تخيل نموذج ذكاء اصطناعي ينتج مزيجًا مثيرًا للاهتمام حقًا من الأنماط الموسيقية أو حتى "كتابة" أفلام طويلة مثيرة للاهتمام في كيفية ربط المفاهيم والأساليب معًا. 

على العكس من ذلك ، من الصعب تخيل أن الأنظمة السابقة ستحتوي على جميع الأدوات التي نحتاجها لتطوير جميع الأنظمة المستقبلية. أو حتى تلك الأنظمة المعقدة يمكن دمجها بسهولة مثل أنماط مختلفة من الفن أو الموسيقى. غالبًا ما تكون قيمة النظام ، وسبب صعوبة بنائه ، في ذيل طويل من التفاصيل - جميع المفاضلات ، والحلول ، والتحسينات لمساحة تصميم معينة ، والمعرفة المؤسسية / الكامنة التي تحتوي عليها. لذلك يجب علينا الاستمرار في البناء.

سنقاوم الرغبة في التنبؤ بالضبط كيف سيؤثر الذكاء الاصطناعي التوليدي على الصناعة الإبداعية. لكن، يشير التاريخ إلى أن الأدوات الجديدة تميل إلى توسيع بدلا من التعاقد على تعريف الفنولجعلها في متناول أنواع جديدة من الفنانين. في هذه الحالة ، الفنانون الجدد هم بناة الأنظمة. لذا، بالنسبة لمؤسسي التكنولوجيا ، نعتقد أن الذكاء الاصطناعي التوليدي هو أداة إيجابية تمامًا لتوسيع نطاق البرامج - ستكون الألعاب أكثر جمالًا ، وتسويق محتوى أكثر إقناعًا ، ومحتوى مكتوبًا أكثر جاذبية ، والأفلام أكثر إلهامًا.

من يدري: في يوم من الأيام ، قد يُعتز بأرشيف الإنترنت في أواخر عام 2022 باعتباره واحدًا من آخر مستودعات المحتوى التي أنشأها الإنسان في الغالب. هذا النص لهذه المقالة ، على الأقل ، تم إنشاؤه بالكامل بواسطة البشر. 

الفن ليس ميتًا ، إنه مجرد ذكاء بيانات PlatoBlockchain المولدة آليًا. البحث العمودي. عاي.
كتب هذه القطعة فريق عمل الأشعة تحت الحمراء a16z ، مع المؤلفين الأساسيين جويدو أبينزيلر ، ومات بورنشتاين ، ومارتن كاسادو ، ويوكو لي ، ومساهمة كبيرة من بقية الفريق.

***

الآراء المعبر عنها هنا هي آراء أفراد AH Capital Management، LLC ("a16z") المقتبس منهم وليست آراء a16z أو الشركات التابعة لها. تم الحصول على بعض المعلومات الواردة هنا من مصادر خارجية ، بما في ذلك من شركات محافظ الصناديق التي تديرها a16z. على الرغم من أنه مأخوذ من مصادر يُعتقد أنها موثوقة ، لم تتحقق a16z بشكل مستقل من هذه المعلومات ولا تقدم أي تعهدات حول الدقة الحالية أو الدائمة للمعلومات أو ملاءمتها لموقف معين. بالإضافة إلى ذلك ، قد يتضمن هذا المحتوى إعلانات جهات خارجية ؛ لم تقم a16z بمراجعة مثل هذه الإعلانات ولا تصادق على أي محتوى إعلاني وارد فيها.

يتم توفير هذا المحتوى لأغراض إعلامية فقط ، ولا ينبغي الاعتماد عليه كمشورة قانونية أو تجارية أو استثمارية أو ضريبية. يجب عليك استشارة مستشاريك بخصوص هذه الأمور. الإشارات إلى أي أوراق مالية أو أصول رقمية هي لأغراض توضيحية فقط ، ولا تشكل توصية استثمارية أو عرضًا لتقديم خدمات استشارية استثمارية. علاوة على ذلك ، هذا المحتوى غير موجه أو مخصص للاستخدام من قبل أي مستثمرين أو مستثمرين محتملين ، ولا يجوز الاعتماد عليه تحت أي ظرف من الظروف عند اتخاذ قرار بالاستثمار في أي صندوق تديره a16z. (سيتم تقديم عرض للاستثمار في صندوق a16z فقط من خلال مذكرة الاكتتاب الخاص واتفاقية الاشتراك والوثائق الأخرى ذات الصلة لأي صندوق من هذا القبيل ويجب قراءتها بالكامل.) أي استثمارات أو شركات محفظة مذكورة ، يشار إليها ، أو الموصوفة لا تمثل جميع الاستثمارات في السيارات التي تديرها a16z ، ولا يمكن أن يكون هناك ضمان بأن الاستثمارات ستكون مربحة أو أن الاستثمارات الأخرى التي تتم في المستقبل سيكون لها خصائص أو نتائج مماثلة. قائمة الاستثمارات التي أجرتها الصناديق التي يديرها Andreessen Horowitz (باستثناء الاستثمارات التي لم يمنحها المُصدر إذنًا لـ a16z للإفصاح علنًا عن الاستثمارات غير المعلنة في الأصول الرقمية المتداولة علنًا) على https://a16z.com/investments /.

الرسوم البيانية والرسوم البيانية المقدمة في الداخل هي لأغراض إعلامية فقط ولا ينبغي الاعتماد عليها عند اتخاذ أي قرار استثماري. الأداء السابق ليس مؤشرا على النتائج المستقبلية. المحتوى يتحدث فقط اعتبارًا من التاريخ المشار إليه. أي توقعات وتقديرات وتنبؤات وأهداف وآفاق و / أو آراء معبر عنها في هذه المواد عرضة للتغيير دون إشعار وقد تختلف أو تتعارض مع الآراء التي يعبر عنها الآخرون. يرجى الاطلاع على https://a16z.com/disclosures للحصول على معلومات إضافية مهمة.

الطابع الزمني:

اكثر من أندرسن هورويتز