ألعاب Google Genie AI Crafts من الصور الفردية

ألعاب Google Genie AI Crafts من الصور الفردية

أعلنت شركة جوجل عن تطبيق Genie، وهو تطبيق لصنع ألعاب الهاتف المحمول، كجزء من استثمارها المستمر في الذكاء الاصطناعي. 

أظهر نموذج الذكاء الاصطناعي التوليدي Genie، الذي طورته شركة DeepMind الناشئة في Google، عرضًا توضيحيًا مباشرًا. تتعلم Genie آليات اللعبة من مئات الآلاف من مقاطع فيديو اللعب ويمكنها إنشاء ألعاب قابلة للعب بأقل قدر من المطالبات.

اقرأ أيضا: الذكاء الاصطناعي يجمع 675 مليون دولار من أجل الروبوتات البشرية لحل العمالة

الكشف عن الجني

كما جاء في DeepMind الرسمي لشركة جوجل بلوق وظيفة، Genie هو نموذج عالمي تأسيسي تم تدريبه باستخدام مقاطع الفيديو عبر الإنترنت. يمكن للنموذج إنتاج "مجموعة لا حصر لها من العوالم القابلة للتشغيل (التي يمكن التحكم فيها) من الصور الاصطناعية والصور الفوتوغرافية وحتى الرسومات التخطيطية".

تم تطوير Genie، وهو اختصار لعبارة "البيئات التفاعلية التوليدية"، بالشراكة بين Google وجامعة كولومبيا البريطانية. باستخدام صورة واحدة فقط، يمكنه إنشاء منصات ثنائية الأبعاد قابلة للتمرير الجانبي مثل Contra وSuper Mario Brothers بناءً على مطالبات المستخدم.

ومع ذلك، ذكرت Google DeepMind خلال الإعلان أنها تقدم "نموذجًا جديدًا" للذكاء الاصطناعي التوليدي (AI) في شكل Genie. بالإضافة إلى ذلك، أقرت الشركة بظهور نماذج الذكاء الاصطناعي التوليدية القادرة على توليد محتوى جديد ومبدع عبر اللغة والصور وحتى مقاطع الفيديو.

وفقًا لجوجل، فإن جزءًا كبيرًا من 200,000 ألف ساعة من مقاطع فيديو الألعاب العامة عبر الإنترنت غير الخاضعة للرقابة والتي تم تدريب جيني عليها هي منصات ثنائية الأبعاد وليست ألعاب واقع افتراضي كاملة.

مواصفات الجني

عندما يتعلق الأمر بالأبعاد، فإن Genie يبلغ 11 مليار معلمة. يتم أيضًا تضمين رمز الفيديو الزماني المكاني، ونموذج ديناميكيات الانحدار الذاتي، ونموذج عمل كامن بسيط وقابل للتطوير في النموذج. تتيح هذه المواصفات لشركة Genie العمل في البيئات التي تم إنشاؤها إطارًا تلو الآخر، حتى بدون تسميات أو متطلبات أخرى خاصة بالمجال عند التدريب.

بالإضافة إلى ذلك، يمكن توجيه جيني لإنشاء مجموعة متنوعة من البيئات التفاعلية التي يمكن التحكم فيها، على الرغم من تدريبها على بيانات الفيديو فقط. يمكن لـ Genie إنشاء بيئات قابلة للتشغيل باستخدام صورة واحدة فقط، على عكس العديد من نماذج الذكاء الاصطناعي التوليدية التي يمكنها إنتاج محتوى إبداعي باستخدام الصور اللغوية وحتى مقاطع الفيديو.

ومع ذلك، قال تيم روكتاشيل، مطور جوجل ديب مايند، على موقع X (تويتر سابقًا) إنهم يركزون على الحجم بدلاً من إضافة تحيزات استقرائية.

وأضاف أنهم يستخدمون مجموعة بيانات تزيد عن 200 ألف ساعة من مقاطع الفيديو من منصات ثنائية الأبعاد ويقومون بتدريب نموذج عالمي 2B. بطريقة غير خاضعة للرقابة، يتعلم الجني أفعالًا كامنة متنوعة تتحكم في الشخصيات باستمرار.

ألعاب Google Genie AI Crafts من الصور الفردية
رصيد الصورة: Google

قدرات الجني

وفقًا شراء مراجعات جوجل الباحثون، تعتمد شركة Genie على ثلاثة نماذج: نموذج ديناميكي يتنبأ بما سيحدث في الإطار التالي، ورمز فيديو يحول إطارات الفيديو الأولية إلى رموز منفصلة، ​​ونموذج عمل كامن يمكنه استنتاج الإجراءات بين إطارات الفيديو.

تعد قدرة النموذج الأساسي لشركة Genie على تحديد الشخصية الأساسية للعبة دون التدريب على الحركة أو التعليقات التوضيحية النصية إحدى ميزاتها الفريدة. بفضل النماذج التي تحركها، يمكن للمستخدم التحكم في الشخصية بسهولة مولدة بالذكاء الاصطناعي بيئة الواقع الافتراضي.

قال Rocktäschel أيضًا أن Genie يمكنه تحويل الوسائط الأخرى إلى ألعاب. يمكن أن يُطلب من Genie إنشاء عوالم افتراضية متنوعة يمكن التحكم فيها من خلال مدخلات مختلفة في ورقة بحث Google DeepMind المصاحبة.

علاوة على ذلك، قال Rocktäschel إن النموذج يمكنه تحويل أي صورة إلى عالم ثنائي الأبعاد قابل للتشغيل. ووفقا له، يستطيع جيني إحياء الإبداعات التي صممها الإنسان مثل الرسومات، على سبيل المثال، الأعمال الفنية الجميلة من سينيكا وكاسبيان، وهما من أصغر المبدعين على الإطلاق في العالم.

الطابع الزمني:

اكثر من ميتا نيوز