ثورة الذكاء الاصطناعي التوليدية في ألعاب ذكاء بيانات بلاتوبلوك تشين. البحث العمودي. عاي.

ثورة الذكاء الاصطناعي التوليدية في الألعاب

لفهم كيف أن الألعاب على وشك التحول جذريًا بواسطة Generative AI ، لا تنظر إلى أبعد من هذا الحديث مشاركة Twitter by @ emmanuel_2m. في هذا المنشور ، يستكشف استخدام Stable Diffusion + Dreambooth ، نماذج الذكاء الاصطناعي العام ثنائية الأبعاد الشهيرة ، لتوليد صور للجرعات للعبة افتراضية.

ما يغير هذا العمل ليس فقط أنه يوفر الوقت والمال مع تقديم الجودة أيضًا - وبالتالي تحطيم المثلث الكلاسيكي "يمكنك فقط الحصول على اثنين من التكلفة أو الجودة أو السرعة". يعمل الفنانون الآن على إنشاء صور عالية الجودة في غضون ساعات كان من الممكن أن يستغرق إنشاؤها يدويًا أسابيع. ما هو تحويلي حقًا هو:

  • هذه القوة الإبداعية متاحة الآن لأي شخص يمكنه تعلم بعض الأدوات البسيطة.
  • يمكن لهذه الأدوات إنشاء عدد لا حصر له من الاختلافات بطريقة تكرارية للغاية.
  • بمجرد التدريب ، تكون العملية في الوقت الفعلي - النتائج متاحة بشكل شبه فوري.

لم تكن هناك تقنية ثورية للألعاب منذ الوقت الحقيقي ثلاثية الأبعاد. اقضِ أي وقت على الإطلاق في التحدث إلى صانعي الألعاب ، وستشعر بالإثارة والاندهاش. إذن إلى أين تتجه هذه التكنولوجيا؟ وكيف ستحول الألعاب؟ أولاً ، دعنا نراجع ما هو الذكاء الاصطناعي التوليدي؟

المحتويات

ما هو الذكاء الاصطناعي التوليدي

الذكاء الاصطناعي التوليدي هو فئة من فئات التعلم الآلي حيث يمكن لأجهزة الكمبيوتر إنشاء محتوى جديد أصلي استجابة لمطالبات المستخدم. تعد النصوص والصور اليوم أكثر التطبيقات نضجًا لهذه التقنية ، ولكن هناك عمل جاري في كل مجال إبداعي تقريبًا ، من الرسوم المتحركة ، إلى المؤثرات الصوتية ، إلى الموسيقى ، وحتى إنشاء شخصيات افتراضية بشخصيات كاملة.

الذكاء الاصطناعي ليس شيئًا جديدًا في الألعاب بالطبع. حتى الألعاب المبكرة ، مثل لعبة Atari's Pong ، كان لديها خصوم يتحكم فيهم الكمبيوتر لتحدي اللاعب. ومع ذلك ، لم يكن هؤلاء الأعداء الافتراضيون يديرون الذكاء الاصطناعي كما نعرفه اليوم. لقد كانت مجرد إجراءات مكتوبة بواسطة مصممي الألعاب. لقد قاموا بمحاكاة خصم ذكي اصطناعيًا ، لكنهم لم يتمكنوا من التعلم ، وكانوا فقط بنفس جودة المبرمجين الذين قاموا ببنائهم.

ما يختلف الآن هو مقدار قوة الحوسبة المتاحة ، بفضل المعالجات الدقيقة والسحابة الأسرع. بهذه القوة ، من الممكن بناء شبكات عصبية كبيرة يمكنها تحديد الأنماط والتمثيلات في المجالات شديدة التعقيد.

تتكون مشاركة المدونة هذه من جزأين:

  • يتكون الجزء الأول من ملاحظاتنا وتوقعاتنا لمجال الذكاء الاصطناعي التوليدي للألعاب.
  • الجزء الثاني هو خارطة السوق الخاصة بنا للمساحة ، ويحدد القطاعات المختلفة ويحدد الشركات الرئيسية في كل منها.

المحتويات

الافتراضات

أولاً ، دعنا نستكشف بعض الافتراضات الكامنة وراء بقية منشور المدونة هذا:

1. كمية الأبحاث التي يتم إجراؤها بشكل عام للذكاء الاصطناعي سوف تستمر في النمو ، مما يخلق تقنيات أكثر فاعلية من أي وقت مضى

ضع في اعتبارك هذا الرسم البياني لعدد الأوراق الأكاديمية المنشورة على التعلم الآلي أو الذكاء الاصطناعي في أرشيف arXiv كل شهر:

ثورة الذكاء الاصطناعي التوليدية في ألعاب ذكاء بيانات بلاتوبلوك تشين. البحث العمودي. عاي.كما ترى ، يتزايد عدد الأوراق بشكل كبير ، مع عدم وجود علامة على التباطؤ. وهذا يشمل فقط الأوراق المنشورة - لم يتم نشر الكثير من الأبحاث مطلقًا ، وتذهب مباشرة إلى نماذج مفتوحة المصدر أو البحث والتطوير للمنتج. والنتيجة انفجار في الاهتمام والابتكار.

2. من بين جميع وسائل الترفيه ، ستكون الألعاب هي الأكثر تأثراً بالذكاء الاصطناعي التوليفي

الألعاب هي أكثر أشكال الترفيه تعقيدًا ، من حيث العدد الهائل من أنواع الأصول المعنية (الفن ثنائي الأبعاد ، والفن ثلاثي الأبعاد ، والمؤثرات الصوتية ، والموسيقى ، والحوار ، وما إلى ذلك). الألعاب هي أيضًا الأكثر تفاعلية ، مع التركيز الشديد على تجارب الوقت الفعلي. هذا يخلق حاجزًا حادًا أمام دخول مطوري الألعاب الجدد ، فضلاً عن تكلفة باهظة لإنتاج لعبة حديثة تتصدر المخططات. كما أنه يخلق فرصة هائلة لتعطيل الذكاء الاصطناعي التوليدي.

ثورة الذكاء الاصطناعي التوليدية في ألعاب ذكاء بيانات بلاتوبلوك تشين. البحث العمودي. عاي.

النظر في لعبة مثل الأحمر الميت الخلاص 2، واحدة من أغلى الألعاب التي تم إنتاجها على الإطلاق ، حيث تكلف صنعها ما يقرب من 500 مليون دولار. من السهل معرفة السبب - فهي تمتلك واحدًا من أجمل العوالم الافتراضية التي تم تحقيقها بالكامل من أي لعبة في السوق. استغرق الأمر أيضًا ما يقرب من 8 سنوات للبناء ، ويضم أكثر من 1,000 شخصية غير قابلة للعب (لكل منها شخصيتها الخاصة ، وأعمالها الفنية ، وممثلها الصوتي) ، وعالم تبلغ مساحته 30 ميلًا مربعًا تقريبًا ، وأكثر من 100 مهمة مقسمة على 6 فصول ، و ما يقرب من 60 ساعة من الموسيقى التي أنشأها أكثر من 100 موسيقي. كل شيء عن هذه اللعبة كبير.

ثورة الذكاء الاصطناعي التوليدية في ألعاب ذكاء بيانات بلاتوبلوك تشين. البحث العمودي. عاي.

قارن الآن Red Dead Redemption 2 بـ مايكروسوفت طيران محاكي، وهي ليست كبيرة فقط ، إنها هائلة. يتيح Microsoft Flight Simulator للاعبين التحليق حول كوكب الأرض بأكمله ، والذي تبلغ مساحته 197 مليون ميل مربع. كيف قامت Microsoft ببناء مثل هذه اللعبة الضخمة؟ من خلال السماح للذكاء الاصطناعي بالقيام بذلك. دخلت Microsoft في شراكة مع بلاشارك، ودربت الذكاء الاصطناعي على إنشاء عالم ثلاثي الأبعاد واقعي من صور الأقمار الصناعية ثنائية الأبعاد.

ثورة الذكاء الاصطناعي التوليدية في ألعاب ذكاء بيانات بلاتوبلوك تشين. البحث العمودي. عاي.

هذا مثال على لعبة كان من المستحيل حرفياً بناؤها بدون استخدام الذكاء الاصطناعي ، علاوة على ذلك ، يستفيد من حقيقة أن هذه النماذج يمكن تحسينها باستمرار بمرور الوقت. على سبيل المثال ، يمكنهم تحسين نموذج "جسر الطريق السريع البرسيم" ، وإعادة تشغيل عملية البناء بأكملها ، وفجأة تم تحسين جميع ممرات الطرق السريعة على الكوكب بأكمله.

3. سيكون هناك نموذج ذكاء اصطناعي توليدي لكل أصل معني بإنتاج اللعبة

حتى الآن ، استحوذت مولدات الصور ثنائية الأبعاد مثل Stable Diffusion أو MidJourney على غالبية الإثارة الشعبية حول الذكاء الاصطناعي التوليفي نظرًا للطبيعة الجذابة للصور التي يمكن أن تولدها. ولكن هناك بالفعل نماذج ذكاء اصطناعي عام لجميع الأصول المشاركة في الألعاب تقريبًا ، من النماذج ثلاثية الأبعاد إلى الرسوم المتحركة للشخصيات والحوار والموسيقى. يتضمن النصف الثاني من منشور المدونة هذا خريطة سوق تسلط الضوء على بعض الشركات التي تركز على كل نوع من أنواع المحتوى.

4. سينخفض ​​سعر المحتوى بشكل كبير ، وسيصل فعليًا إلى الصفر في بعض الحالات.

عند التحدث إلى مطوري الألعاب الذين يختبرون دمج الذكاء الاصطناعي التوليفي في خطوط الإنتاج الخاصة بهم ، فإن الإثارة الأكبر تكون حول التخفيض الكبير في الوقت والتكلفة. أخبرنا أحد المطورين أن الوقت الذي أمضاه في إنشاء فكرة فنية لصورة واحدة ، من البداية إلى النهاية ، انخفض من 3 أسابيع إلى ساعة واحدة: تخفيض 120 إلى 1. نعتقد أنه سيكون من الممكن تحقيق وفورات مماثلة عبر خط أنابيب الإنتاج بأكمله.

لنكون واضحين ، الفنانين ليسوا في خطر الاستبدال. هذا يعني أن الفنانين لم يعودوا بحاجة إلى القيام بكل العمل بأنفسهم: يمكنهم الآن تحديد الاتجاه الإبداعي الأولي ، ثم تسليم الكثير من الوقت المستغرق والتنفيذ الفني للذكاء الاصطناعي. في هذا ، هم مثل رسامي السليلوز من الأيام الأولى للرسوم المتحركة المرسومة يدويًا حيث قام "محبرون" ذوو مهارات عالية برسم الخطوط العريضة للرسوم المتحركة ، ومن ثم تقوم جيوش "الرسامين" الأقل تكلفة بالعمل الذي يستغرق وقتًا طويلاً في رسم اللوحة. سيل الرسوم المتحركة ، وملء السطور. إنه "الإكمال التلقائي" لإنشاء اللعبة.

5. ما زلنا في مهد هذه الثورة وهناك الكثير من الممارسات التي لا تزال بحاجة إلى صقل

على الرغم من كل هذه الإثارة الأخيرة ، ما زلنا في خط البداية. هناك قدر هائل من العمل أمامنا حيث نكتشف كيفية تسخير هذه التكنولوجيا الجديدة للألعاب ، وسيتم إنشاء فرص هائلة للشركات التي تنتقل بسرعة إلى هذا الفضاء الجديد.

المحتويات

تنبؤات

بالنظر إلى هذه الافتراضات ، إليك بعض التوقعات حول كيفية تحول صناعة الألعاب:

1. سيصبح تعلم كيفية استخدام الذكاء الاصطناعي التوليدي بشكل فعال مهارة قابلة للتسويق

بالفعل نرى بعض المجربين يستخدمون الذكاء الاصطناعي التوليدي بشكل أكثر فعالية من الآخرين. لتحقيق أقصى استفادة من هذه التقنية الجديدة ، يتطلب استخدام مجموعة متنوعة من الأدوات والتقنيات ومعرفة كيفية التنقل بينها. نتوقع أن تصبح هذه مهارة قابلة للتسويق ، تجمع بين الرؤية الإبداعية للفنان والمهارات التقنية للمبرمج.

يشتهر كريس أندرسون بقوله ، "كل وفرة تخلق ندرة جديدة." نظرًا لأن المحتوى أصبح وفيرًا ، نعتقد أن الفنانين هم الذين يعرفون كيفية العمل بشكل تعاوني وفعال مع أدوات الذكاء الاصطناعي الذين سيكونون في أقل عرض.

على سبيل المثال ، يتطلب استخدام الذكاء الاصطناعي التوليفي في إنتاج العمل الفني تحديات خاصة ، بما في ذلك:

  • منطق. مع أي أصل إنتاج ، يجب أن تكون قادرًا على إجراء تغييرات أو تعديلات على الأصل في المستقبل. باستخدام أداة الذكاء الاصطناعي ، يعني ذلك الحاجة إلى القدرة على إعادة إنتاج الأصل بنفس الموجه ، بحيث يمكنك بعد ذلك إجراء التغييرات. قد يكون هذا خادعًا لأن نفس الموجه يمكن أن يؤدي إلى نتائج مختلفة إلى حد كبير.
  • قلم المدقة. من المهم أن يكون لكل الأعمال الفنية في لعبة ما أسلوب متسق - مما يعني أن أدواتك تحتاج إلى التدريب على أسلوبك المعين أو ربطه بطريقة أخرى.

2. سيؤدي خفض الحواجز إلى المزيد من المخاطرة والاستكشاف الإبداعي

ربما ندخل قريبًا "عصرًا ذهبيًا" جديدًا لتطوير الألعاب ، حيث يؤدي وجود حاجز أقل أمام الدخول إلى انفجار ألعاب أكثر إبداعًا وإبداعًا. ليس فقط لأن تكاليف الإنتاج المنخفضة تؤدي إلى تقليل المخاطر ، ولكن لأن هذه الأدوات تطلق القدرة على إنشاء محتوى عالي الجودة لجمهور أوسع. الأمر الذي يؤدي إلى التنبؤ التالي ...

3. ارتفاع في "استوديوهات الألعاب الصغيرة" المدعومة بالذكاء الاصطناعي

مسلحين بأدوات وخدمات الذكاء الاصطناعي التوليدية ، سنبدأ في رؤية المزيد من الألعاب التجارية القابلة للتطبيق التي تنتجها "استوديوهات صغيرة" صغيرة تضم موظفًا واحدًا أو اثنين فقط. فكرة استوديو الألعاب المستقلة الصغيرة ليست لعبة جديدة Among Us تم إنشاؤه بواسطة studio Innersloth مع 5 موظفين فقط - ولكن حجم وحجم الألعاب التي يمكن أن تنشئها هذه الاستوديوهات الصغيرة سيزدادان. سينتج عن هذا ...

4. زيادة في عدد الألعاب الصادرة كل عام

أظهر نجاح Unity و Roblox أن توفير أدوات إبداعية قوية يؤدي إلى بناء المزيد من الألعاب. ستعمل تقنية الذكاء الاصطناعي التوليفية على خفض المستوى إلى أبعد من ذلك ، مما يؤدي إلى إنشاء عدد أكبر من الألعاب. الصناعة تعاني بالفعل من تحديات الاكتشاف - أكثر من تمت إضافة 10,000 لعبة إلى Steam في العام الماضي وحده - وسيزيد هذا من الضغط على الاكتشاف. ومع ذلك سنرى أيضًا ...

5. تم إنشاء أنواع ألعاب جديدة لم تكن ممكنة قبل Generative AI

سنرى أنواعًا جديدة من الألعاب تم اختراعها والتي لم تكن ممكنة بدون الذكاء الاصطناعي التوليدي. لقد تحدثنا بالفعل عن جهاز محاكاة الطيران من Microsoft ، ولكن سيكون هناك أنواع جديدة تمامًا تم اختراعها والتي تعتمد على إنشاء محتوى جديد في الوقت الفعلي.

نظر السهم، من خلال spellbrush. هذه لعبة RPG تتميز بشخصيات تم إنشاؤها بواسطة AI للعب جديد غير محدود تقريبًا.

نحن نعرف أيضًا مطور ألعاب آخر يستخدم الذكاء الاصطناعي للسماح للاعبين بإنشاء الصورة الرمزية الخاصة بهم داخل اللعبة. في السابق ، كان لديهم مجموعة من الصور الرمزية المرسومة يدويًا والتي يمكن للاعبين مزجها ومطابقتها لإنشاء الصورة الرمزية الخاصة بهم - الآن قاموا برميها بالكامل ، ويقومون ببساطة بإنشاء الصورة الرمزية من وصف اللاعب. يعد السماح للاعبين بإنشاء محتوى من خلال الذكاء الاصطناعي أكثر أمانًا من السماح للاعبين بتحميل المحتوى الخاص بهم من البداية ، حيث يمكن تدريب الذكاء الاصطناعي على تجنب إنشاء محتوى مسيء ، مع استمرار منح اللاعبين إحساسًا أكبر بالملكية.

6. ستتراكم القيمة لأدوات الذكاء الاصطناعي الخاصة بالصناعة ، وليس فقط النماذج التأسيسية

تولد الإثارة والضجة حول النماذج التأسيسية مثل Stable Diffusion و Midjourney تقييمات مذهلة ، لكن التدفق المستمر للأبحاث الجديدة يضمن أن النماذج الجديدة ستأتي وتذهب مع تحسين التقنيات الجديدة. ضع في اعتبارك حركة مرور البحث على موقع الويب إلى 3 نماذج Generative AI شائعة: Dall-E و Midjourney و Stable Diffusion. كل نموذج جديد له دوره في دائرة الضوء.

ثورة الذكاء الاصطناعي التوليدية في ألعاب ذكاء بيانات بلاتوبلوك تشين. البحث العمودي. عاي.

قد يكون النهج البديل هو بناء مجموعات أدوات متوافقة مع الصناعة تركز على احتياجات الذكاء الاصطناعي التوليدية لصناعة معينة ، مع فهم عميق لجمهور معين ، وتكامل ثري في خطوط الإنتاج الحالية (مثل Unity أو Unreal للألعاب).

مثال جيد هو مدرج المطار الذي يستهدف احتياجات منشئي الفيديو باستخدام أدوات مساعدة AI مثل تحرير الفيديو ، وإزالة الشاشة الخضراء ، و inpainting ، وتتبع الحركة. يمكن لأدوات مثل هذه بناء جمهور معين وتحقيق الدخل منه ، وإضافة نماذج جديدة بمرور الوقت. لم نشهد بعد ظهور مجموعة مثل Runway للألعاب ، لكننا نعلم أنها مساحة للتطوير النشط.

7. التحديات القانونية قادمة

ما تشترك فيه كل نماذج الذكاء الاصطناعي التوليدية هذه هو أنها مدربة باستخدام مجموعات بيانات ضخمة من المحتوى ، غالبًا ما يتم إنشاؤها عن طريق تجريف الإنترنت نفسه. الانتشار المستقر ، على سبيل المثال ، يتم تدريبه على أكثر من 5 مليارات زوج من الصور / التسمية التوضيحية ، تم كشطها من الويب.

في الوقت الحالي ، تدعي هذه النماذج أنها تعمل بموجب مبدأ "الاستخدام العادل" لحقوق الطبع والنشر ، ولكن لم يتم اختبار هذه الحجة بشكل نهائي في المحكمة بعد. يبدو من الواضح أن التحديات القانونية قادمة والذي من المحتمل أن يغير المشهد العام للذكاء الاصطناعي التوليدي.

من الممكن أن تسعى الاستوديوهات الكبيرة إلى الحصول على ميزة تنافسية من خلال بناء نماذج احتكارية مبنية على محتوى داخلي لديهم حق واضح وملكيتها. Microsoft ، على سبيل المثال ، في وضع جيد بشكل خاص هنا مع 23 استوديو للحفل الأول اليوم، و 7 أخرى بعد إغلاق استحواذها على Activision.

8. لن تتعطل البرمجة بعمق مثل المحتوى الفني - على الأقل حتى الآن

تعتبر هندسة البرمجيات التكلفة الرئيسية الأخرى لتطوير اللعبة ، ولكن كما شارك زملاؤنا في فريق a16z Enterprise في منشور المدونة الأخير الخاص بهم ، الفن ليس ميتًا ، إنه مجرد آلة مولدة، يتطلب إنشاء رمز باستخدام نموذج AI مزيدًا من الاختبار والتحقق ، وبالتالي يكون تحسين الإنتاجية أقل من إنشاء الأصول الإبداعية. قد توفر أدوات التشفير مثل Copilot تحسينات معتدلة في أداء المهندسين ، ولكن لن يكون لها نفس التأثير ... على الأقل في أي وقت قريب.

المحتويات

توصيات

بناءً على هذه التوقعات ، نقدم التوصيات التالية:

1. ابدأ في استكشاف الذكاء الاصطناعي التوليدي الآن

سيستغرق الأمر بعض الوقت لمعرفة كيفية الاستفادة الكاملة من قوة ثورة الذكاء الاصطناعي التوليدية القادمة. ستتمتع الشركات التي تبدأ الآن بميزة لاحقًا. نحن نعرف العديد من الاستوديوهات التي لديها مشاريع تجريبية داخلية جارية لاستكشاف كيف يمكن لهذه التقنيات أن تؤثر على الإنتاج.

2. ابحث عن فرص خريطة السوق

بعض أجزاء خريطة السوق لدينا مزدحمة للغاية بالفعل ، مثل الرسوم المتحركة أو الكلام والحوار ، ولكن هناك مناطق أخرى مفتوحة على مصراعيها. نحن نشجع رواد الأعمال المهتمين بهذا الفضاء على تركيز جهودهم على المجالات التي لم يتم استكشافها بعد ، مثل "Runway for Games".

المحتويات

الوضع الحالي للسوق

لقد أنشأنا خريطة سوق لالتقاط قائمة بالشركات التي حددناها في كل فئة من هذه الفئات حيث نرى ألعاب الذكاء الاصطناعي التوليفية المؤثرة. يمر منشور المدونة هذا عبر كل فئة من هذه الفئات ، ويشرحها بمزيد من التفصيل قليلاً ، ويسلط الضوء على أكثر الشركات إثارة في كل فئة.

ثورة الذكاء الاصطناعي التوليدية في ألعاب ذكاء بيانات بلاتوبلوك تشين. البحث العمودي. عاي.

المحتويات

صور 2D

يعد إنشاء صور ثنائية الأبعاد من المطالبات النصية بالفعل أحد أكثر المجالات تطبيقاً على نطاق واسع في الذكاء الاصطناعي التوليدي. أدوات مثل ميدجورني, انتشار مستقرو دال-E 2 يمكنها إنشاء صور ثنائية الأبعاد عالية الجودة من النص ، وقد وجدت بالفعل طريقها إلى إنتاج اللعبة في مراحل متعددة من دورة حياة اللعبة.

مفهوم الفن

تعتبر أدوات الذكاء الاصطناعي التوليدية ممتازة في "التفكير" أو مساعدة غير الفنانين ، مثل مصممي الألعاب ، على استكشاف المفاهيم والأفكار بسرعة كبيرة لإنشاء عمل فني مفاهيمي ، وهو جزء أساسي من عملية الإنتاج. على سبيل المثال ، يستخدم أحد الأستوديوهات (البقاء مجهولاً) العديد من هذه الأدوات معًا لتسريع عملية فن المفاهيم بشكل جذري ، ويستغرق يومًا واحدًا لإنشاء صورة كان من الممكن التقاطها في السابق لمدة تصل إلى 3 أسابيع.

  • أولاً ، يستخدم مصممو ألعابهم Midjourney لاستكشاف أفكار مختلفة وإنشاء صور يجدونها ملهمة.
  • يتم تحويلها إلى فنان مفهوم محترف يقوم بتجميعها معًا ورسم النتيجة لإنشاء صورة واحدة متماسكة - والتي يتم إدخالها بعد ذلك في Stable Diffusion لإنشاء مجموعة من الاختلافات.
  • يناقشون هذه الاختلافات ، ويختارون واحدًا ، ويرسمون في بعض التعديلات يدويًا - ثم كرر العملية حتى يصبحوا سعداء بالنتيجة.
  • في تلك المرحلة ، قم بتمرير هذه الصورة مرة أخرى إلى Stable Diffusion للمرة الأخيرة "لترقيتها" لإنشاء القطعة الفنية النهائية.

2D فن الإنتاج

تقوم بعض الاستوديوهات بالفعل بتجربة استخدام نفس الأدوات للعمل الفني للإنتاج داخل اللعبة. على سبيل المثال ، هذا لطيف البرنامج التعليمي من ألبرت بوزان على استخدام Stable Diffusion لإنشاء أصول ثنائية الأبعاد داخل اللعبة.

المحتويات

عمل فني ثلاثي الأبعاد

الأصول ثلاثية الأبعاد هي لبنة البناء لجميع الألعاب الحديثة ، بالإضافة إلى metaverse القادم. العالم الافتراضي ، أو مستوى اللعبة ، هو في الأساس مجرد مجموعة من الأصول ثلاثية الأبعاد ، يتم وضعها وتعديلها لملء البيئة. ومع ذلك ، فإن إنشاء أصل ثلاثي الأبعاد أكثر تعقيدًا من إنشاء صورة ثنائية الأبعاد ، ويتضمن خطوات متعددة بما في ذلك إنشاء نموذج ثلاثي الأبعاد وإضافة مواد وتأثيرات. بالنسبة للشخصيات المتحركة ، فإنه يتضمن أيضًا إنشاء "هيكل عظمي" داخلي ، ثم إنشاء رسوم متحركة أعلى هذا الهيكل العظمي.

نشهد العديد من الشركات الناشئة المختلفة التي تسير بعد كل مرحلة من عملية إنشاء الأصول ثلاثية الأبعاد ، بما في ذلك إنشاء النماذج والرسوم المتحركة للشخصيات وبناء المستوى. لم يتم حل هذه المشكلة بعد ، ومع ذلك - لا يوجد أي من الحلول جاهز للدمج بالكامل في الإنتاج حتى الآن.

الأصول ثلاثية الأبعاد

تشمل الشركات الناشئة التي تحاول حل مشكلة إنشاء النماذج ثلاثية الأبعاد كاديم, ميراجو مفترس. تبحث الشركات الكبيرة أيضًا في المشكلة ، بما في ذلك شركة Nvidia Get3D وأوتوديسك كليبفورج. يركز Kaedim و Get3d على صورة ثلاثية الأبعاد ؛ يركز ClipForge و Mirage على تحويل النص إلى ثلاثي الأبعاد ، بينما Hypothetic مهتم بكل من البحث من نص إلى ثلاثي الأبعاد ، وكذلك من صورة إلى ثلاثية الأبعاد.

3D القوام

يبدو النموذج الثلاثي الأبعاد واقعيًا فقط مثل النسيج أو المواد التي يتم تطبيقها على الشبكة. يمكن أن يؤدي تحديد أي نسيج حجري مطحلب تم تجفيفه لتطبيقه على نموذج قلعة من العصور الوسطى إلى تغيير شكل ومظهر المشهد تمامًا. تحتوي القوام على بيانات وصفية حول كيفية تفاعل الضوء مع المادة (مثل الخشونة واللمعان وما إلى ذلك). إن السماح للفنانين بإنشاء مواد بسهولة استنادًا إلى النصوص أو مطالبات الصور سيكون ذا قيمة كبيرة لزيادة سرعة التكرار في العملية الإبداعية. العديد من الفرق تسعى وراء هذه الفرصة بما في ذلك الباريوم, Ponzuو ارمور لاب.

الرسوم المتحركة

يعد إنشاء رسوم متحركة رائعة أحد أكثر الأجزاء استهلاكا للوقت وتكلفة ومهارة في عملية إنشاء اللعبة. تتمثل إحدى طرق تقليل التكلفة ، وإنشاء رسوم متحركة أكثر واقعية ، في استخدام التقاط الحركة ، حيث تقوم بوضع ممثل أو راقص في بدلة التقاط الحركة وتسجيلها وهي تتحرك في مرحلة التقاط حركة مُجهزة خصيصًا.

نشاهد الآن نماذج ذكاء اصطناعي توليدية يمكنها التقاط الرسوم المتحركة مباشرة من مقطع فيديو. يعد هذا أكثر فاعلية ، لأنه يلغي الحاجة إلى جهاز التقاط حركة باهظ الثمن ، ولأنه يعني أنه يمكنك التقاط رسوم متحركة من مقاطع الفيديو الموجودة. جانب آخر مثير لهذه النماذج هو أنه يمكن استخدامها أيضًا لتطبيق المرشحات على الرسوم المتحركة الموجودة ، مثل جعلها تبدو في حالة سكر ، أو قديمة ، أو سعيدة. الشركات التي تسعى وراء هذه المساحة تشمل KINETIX, ديب موشن, أصولي, نقل عايو بلاسك.

تصميم المستوى وبناء العالم

يعد بناء عالم اللعبة من أكثر الجوانب التي تستغرق وقتًا طويلاً في إنشاء اللعبة ، وهي مهمة يجب أن يكون الذكاء الاصطناعي التوليدي مناسبًا لها. تشتهر ألعاب مثل Minecraft و No Man's Sky و Diablo بالفعل باستخدام تقنيات إجرائية لإنشاء مستوياتها ، حيث يتم إنشاء المستويات بشكل عشوائي ، ومختلفة في كل مرة ، ولكن وفقًا للقواعد التي وضعها مصمم المستوى. تتمثل إحدى نقاط البيع الكبيرة لمحرك اللعبة Unreal 5 الجديد في مجموعته من الأدوات الإجرائية لتصميم العالم المفتوح ، مثل وضع أوراق الشجر.

لقد رأينا بعض المبادرات في الفضاء ، مثل من Promethean, MLXARأو ميتا منشئ بوت، وأعتقد أنها مسألة وقت فقط قبل أن تحل التقنيات التوليدية محل التقنيات الإجرائية إلى حد كبير. كان هناك بحث أكاديمي في الفضاء لفترة من الوقت ، بما في ذلك التقنيات التوليدية لماين كرافت or تصميم المستوى في Doom.

هناك سبب مقنع آخر للتطلع إلى أدوات إنشاء الذكاء الاصطناعي لتصميم المستوى وهو القدرة على إنشاء مستويات وعوالم بأساليب مختلفة. يمكنك أن تتخيل طرح الأدوات لإنشاء عالم في عصر الزعنفة في عام 1920 في نيويورك ، مقابل المستقبل البائس للعبة النصل ، مقابل عالم الخيال Tolkien-esque.

تم إنشاء المفاهيم التالية بواسطة Midjourney باستخدام الموجه ، "مستوى اللعبة بأسلوب ..."

Audio

الصوت والموسيقى جزء كبير من تجربة اللعب. لقد بدأنا في رؤية شركات تستخدم الذكاء الاصطناعي التوليدي لتوليد الصوت لاستكمال العمل الجاري بالفعل على جانب الرسومات.

مؤثرات صوتيه

تعد المؤثرات الصوتية منطقة مفتوحة جذابة للذكاء الاصطناعي. كانت هناك أوراق أكاديمية استكشاف فكرة استخدام الذكاء الاصطناعي لتوليد "فولي" في الفيلم (مثل الخطوات) ولكن القليل من المنتجات التجارية في الألعاب حتى الآن.

نعتقد أن هذه مسألة وقت فقط ، نظرًا لأن الطبيعة التفاعلية للألعاب تجعل هذا تطبيقًا واضحًا للذكاء الاصطناعي التوليدي ، حيث يتم إنشاء مؤثرات صوتية ثابتة كجزء من الإنتاج ("صوت بندقية الليزر ، بأسلوب حرب النجوم") ، و إنشاء تأثيرات صوتية تفاعلية في الوقت الفعلي في وقت التشغيل.

ضع في اعتبارك شيئًا بسيطًا مثل إصدار أصوات خطوات لشخصية اللاعب. تحل معظم الألعاب هذه المشكلة عن طريق تضمين عدد صغير من أصوات الخطوات المسجلة مسبقًا: المشي على العشب ، والمشي على الحصى ، والجري على العشب ، والجري على الحصى ، وما إلى ذلك ، وهي عملية شاقة لتوليدها وإدارتها ، كما أنها متكررة وغير واقعية في وقت التشغيل.

قد يكون النهج الأفضل هو نموذج الذكاء الاصطناعي التوليدي في الوقت الفعلي للتأثيرات الصوتية الفولي ، والتي يمكن أن تولد مؤثرات صوتية مناسبة ، أثناء الطيران ، بشكل مختلف قليلاً في كل مرة ، والتي تستجيب لمعايير اللعبة مثل سطح الأرض ، ووزن الشخصية ، مشية ، أحذية ، إلخ.

موسيقى

لطالما كانت الموسيقى تحديًا للألعاب. إنه أمر مهم ، لأنه يمكن أن يساعد في ضبط النغمة العاطفية تمامًا كما هو الحال في الفيلم أو التلفزيون ، ولكن نظرًا لأن الألعاب يمكن أن تستمر لمئات أو حتى آلاف الساعات ، فقد تصبح متكررة أو مزعجة بسرعة. أيضًا ، نظرًا للطبيعة التفاعلية للألعاب ، قد يكون من الصعب على الموسيقى مطابقة ما يحدث على الشاشة بدقة في أي وقت.

كانت الموسيقى التكيفية موضوعًا في صوت الألعاب لأكثر من عقدين من الزمن ، حيث تعود إلى "DirectMusic"نظام لإنشاء موسيقى تفاعلية. لم يتم تكييف DirectMusic على نطاق واسع ، ويرجع ذلك إلى حد كبير إلى صعوبة التأليف في التنسيق. فقط عدد قليل من الألعاب ، مثل لعبة Monolith لا احد يعيش للابد، تم إنشاء نتائج تفاعلية حقًا.

الآن نرى عددًا من الشركات تحاول إنشاء موسيقى تم إنشاؤها بواسطة الذكاء الاصطناعي ، مثل سليم, Musico, هارموناي, ألبوم لانهائيو Aiva. وفي حين أن بعض الأدوات اليوم ، مثل الموسيقي بواسطة Open AI ، تكون حسابية مكثفة للغاية ولا يمكن تشغيلها في الوقت الفعلي ، ويمكن تشغيل الغالبية في الوقت الفعلي بمجرد بناء النموذج الأولي.

الكلام والحوار

هناك عدد كبير من الشركات التي تحاول إنشاء أصوات واقعية لشخصيات اللعبة. هذا ليس مفاجئًا نظرًا للتاريخ الطويل لمحاولة منح أجهزة الكمبيوتر صوتًا من خلال تركيب الكلام. تشمل الشركات صوتي, Coqui, استوديوهات المقلدة, يشبه, Readspeaker.ai، وغيرها الكثير.

هناك مزايا متعددة لاستخدام الذكاء الاصطناعي التوليفي للكلام ، وهو ما يفسر جزئيًا سبب ازدحام هذه المساحة.

  • إنشاء حوار سريع. عادةً ما يتم تسجيل الكلام في الألعاب مسبقًا من الممثلين الصوتيين ، ولكن يقتصر ذلك على الخطب المعلبة المسجلة مسبقًا. من خلال حوار الذكاء الاصطناعي التوليدي ، يمكن للشخصيات قول أي شيء - مما يعني أنها يمكن أن تتفاعل بشكل كامل مع ما يفعله اللاعبون. بالاقتران مع نماذج الذكاء الاصطناعي الأكثر ذكاءً لـ NPC (خارج نطاق هذه المدونة ، ولكن مجال الابتكار مثير بنفس القدر في الوقت الحالي) ، فإن وعد الألعاب التي تتفاعل بشكل كامل مع اللاعبين سيأتي قريبًا.
  • لعب الأدوار. يرغب العديد من اللاعبين في اللعب كشخصيات خيالية لا تشبه كثيرًا هويتهم الحقيقية. لكن هذا الخيال ينهار بمجرد أن يتحدث اللاعبون بأصواتهم. إن استخدام صوت تم إنشاؤه يطابق الصورة الرمزية للاعب يحافظ على هذا الوهم.
    مراقبة. أثناء إنشاء الخطاب ، يمكنك التحكم في الفروق الدقيقة في الصوت مثل الضجيج ، والانعطاف ، والرنين العاطفي ، وطول الصوت ، واللهجات ، والمزيد.
  • الموقع. يسمح بترجمة الحوار إلى أي لغة والتحدث بنفس الصوت. شركات مثل ديب داب تركز بشكل خاص على هذا المكانة.

المحتويات

الشخصيات غير القابلة للعب أو شخصيات اللاعب

تبحث العديد من الشركات الناشئة في استخدام الذكاء الاصطناعي التوليدي لإنشاء شخصيات قابلة للتصديق يمكنك التفاعل معها ، ويرجع ذلك جزئيًا إلى أن هذا السوق يتمتع بإمكانية تطبيق واسعة خارج الألعاب ، مثل المساعدين الافتراضيين أو موظفي الاستقبال.

تعود الجهود المبذولة لإنشاء شخصيات يمكن تصديقها إلى بدايات أبحاث الذكاء الاصطناعي. في الواقع ، فإن تعريف "اختبار تورينج" الكلاسيكي للذكاء الاصطناعي هو أن الإنسان يجب ألا يكون قادرًا على التمييز بين محادثة دردشة مع ذكاء اصطناعي مقابل إنسان.

في هذه المرحلة ، هناك المئات من الشركات التي تبني روبوتات محادثة للأغراض العامة ، وكثير منها مدعوم بنماذج اللغات المشابهة لـ GPT-3. يحاول عدد أقل تحديدًا إنشاء روبوتات محادثة بغرض الترفيه ، مثل Replika و أنيما الذين يحاولون تكوين صداقات افتراضية. قد يكون مفهوم مواعدة صديقة افتراضية ، كما تم استكشافه في فيلم Her ، أقرب مما تعتقد.

نشهد الآن التكرار التالي لمنصات chatbot هذه ، مثل كاريزما, كونفاي.كومالطرق أو Inworld.ai، تهدف إلى تعزيز الشخصيات ثلاثية الأبعاد التي تم عرضها بالكامل ، مع المشاعر والوكالة ، مع أدوات للسماح للمبدع بإعطاء هذه الشخصيات أهدافًا. هذا مهم إذا كانوا سينسجمون داخل اللعبة أو لديهم مكان سردي في تقدم الحبكة للأمام ، مقابل مجرد تزيين النوافذ.

المحتويات

منصات الكل في واحد

واحدة من أنجح أدوات الذكاء الاصطناعي التوليدية بشكل عام هي Runwayml.com، لأنه يجمع مجموعة كبيرة من أدوات المنشئين في حزمة واحدة. لا توجد حاليًا منصة من هذا القبيل تخدم ألعاب الفيديو ، ونعتقد أن هذه فرصة تم التغاضي عنها. نود الاستثمار في حل يتميز بما يلي:

  • مجموعة كاملة من أدوات الذكاء الاصطناعي التوليدية التي تغطي عملية الإنتاج بأكملها. (الكود ، وتوليد الأصول ، والقوام ، والصوت ، والأوصاف ، وما إلى ذلك)
  • متكامل بإحكام مع محركات الألعاب الشهيرة مثل Unreal و Unity.
  • مصممة لتناسب خط إنتاج الألعاب النموذجي.

المحتويات

وفي الختام

هذا وقت رائع لتكون صانع ألعاب! بفضل الأدوات الموضحة في منشور المدونة هذا جزئيًا ، لم يكن إنشاء المحتوى المطلوب لبناء لعبة أسهل من أي وقت مضى - حتى لو كانت لعبتك كبيرة مثل الكوكب بأكمله!

حتى أنه من الممكن أن تتخيل يومًا ما لعبة مخصصة بالكامل ، تم إنشاؤها فقط للاعب ، بناءً على ما يريده اللاعب بالضبط. كان هذا في الخيال العلمي لفترة طويلة - مثل "AI Mind Game" في لعبة Ender ، أو Holodeck في Star Trek. ولكن مع تقدم الأدوات الموضحة في منشور المدونة هذا بالسرعة التي هي عليها ، فليس من الصعب تخيل أن هذا الواقع قاب قوسين أو أدنى.

إذا كنت مؤسسًا أو مؤسسًا محتملاً مهتمًا ببناء شركة AI للألعاب ، فيرجى التواصل معنا! نريد أن نسمع منك!

***

الآراء المعبر عنها هنا هي آراء أفراد AH Capital Management، LLC ("a16z") المقتبس منهم وليست آراء a16z أو الشركات التابعة لها. تم الحصول على بعض المعلومات الواردة هنا من مصادر خارجية ، بما في ذلك من شركات محافظ الصناديق التي تديرها a16z. على الرغم من أنه مأخوذ من مصادر يُعتقد أنها موثوقة ، لم تتحقق a16z بشكل مستقل من هذه المعلومات ولا تقدم أي تعهدات حول الدقة الحالية أو الدائمة للمعلومات أو ملاءمتها لموقف معين. بالإضافة إلى ذلك ، قد يتضمن هذا المحتوى إعلانات جهات خارجية ؛ لم تقم a16z بمراجعة مثل هذه الإعلانات ولا تصادق على أي محتوى إعلاني وارد فيها.

يتم توفير هذا المحتوى لأغراض إعلامية فقط ، ولا ينبغي الاعتماد عليه كمشورة قانونية أو تجارية أو استثمارية أو ضريبية. يجب عليك استشارة مستشاريك بخصوص هذه الأمور. الإشارات إلى أي أوراق مالية أو أصول رقمية هي لأغراض توضيحية فقط ، ولا تشكل توصية استثمارية أو عرضًا لتقديم خدمات استشارية استثمارية. علاوة على ذلك ، هذا المحتوى غير موجه أو مخصص للاستخدام من قبل أي مستثمرين أو مستثمرين محتملين ، ولا يجوز الاعتماد عليه تحت أي ظرف من الظروف عند اتخاذ قرار بالاستثمار في أي صندوق تديره a16z. (سيتم تقديم عرض للاستثمار في صندوق a16z فقط من خلال مذكرة الاكتتاب الخاص واتفاقية الاشتراك والوثائق الأخرى ذات الصلة لأي صندوق من هذا القبيل ويجب قراءتها بالكامل.) أي استثمارات أو شركات محفظة مذكورة ، يشار إليها ، أو الموصوفة لا تمثل جميع الاستثمارات في السيارات التي تديرها a16z ، ولا يمكن أن يكون هناك ضمان بأن الاستثمارات ستكون مربحة أو أن الاستثمارات الأخرى التي تتم في المستقبل سيكون لها خصائص أو نتائج مماثلة. قائمة الاستثمارات التي أجرتها الصناديق التي يديرها Andreessen Horowitz (باستثناء الاستثمارات التي لم يمنحها المُصدر إذنًا لـ a16z للإفصاح علنًا عن الاستثمارات غير المعلنة في الأصول الرقمية المتداولة علنًا) على https://a16z.com/investments /.

الرسوم البيانية والرسوم البيانية المقدمة في الداخل هي لأغراض إعلامية فقط ولا ينبغي الاعتماد عليها عند اتخاذ أي قرار استثماري. الأداء السابق ليس مؤشرا على النتائج المستقبلية. المحتوى يتحدث فقط اعتبارًا من التاريخ المشار إليه. أي توقعات وتقديرات وتنبؤات وأهداف وآفاق و / أو آراء معبر عنها في هذه المواد عرضة للتغيير دون إشعار وقد تختلف أو تتعارض مع الآراء التي يعبر عنها الآخرون. يرجى الاطلاع على https://a16z.com/disclosures للحصول على معلومات إضافية مهمة.

الطابع الزمني:

اكثر من أندرسن هورويتز