একক ছবি থেকে Google এর Genie AI Crafts গেম

একক ছবি থেকে Google এর Genie AI Crafts গেম

গুগল কৃত্রিম বুদ্ধিমত্তায় চলমান বিনিয়োগের অংশ হিসাবে মোবাইল গেম তৈরির জন্য একটি অ্যাপ জিনি ঘোষণা করেছে। 

গুগলের এআই স্টার্টআপ ডিপমাইন্ড দ্বারা তৈরি জেনারেটিভ এআই মডেল জিনি একটি লাইভ ডেমো প্রদর্শন করেছে। জেনি কয়েক হাজার গেমপ্লে ভিডিও থেকে গেম মেকানিক্স শেখে এবং ন্যূনতম প্রম্পট সহ খেলার যোগ্য গেম তৈরি করতে পারে।

এছাড়াও পড়ুন: শ্রম-সমাধান হিউম্যানয়েড রোবোটিক্সের জন্য AI $675 মিলিয়ন সংগ্রহ করবে

জিনি উন্মোচন

গুগলের অফিসিয়াল ডিপমাইন্ডে যেমন বলা হয়েছে ব্লগ পোস্ট, Genie অনলাইন ভিডিও ব্যবহার করে প্রশিক্ষিত একটি মৌলিক বিশ্বের মডেল। "সিনথেটিক ইমেজ, ফটোগ্রাফ এবং এমনকি স্কেচ থেকে খেলার যোগ্য (অ্যাকশন-নিয়ন্ত্রণযোগ্য) জগতের একটি অফুরন্ত বৈচিত্র্য" মডেল দ্বারা উত্পাদিত হতে পারে।

জেনি, জেনারেটিভ ইন্টারেক্টিভ এনভায়রনমেন্টের সংক্ষিপ্ত, গুগল এবং ইউনিভার্সিটি অফ ব্রিটিশ কলাম্বিয়ার মধ্যে অংশীদারিত্বে বিকশিত হয়েছিল। শুধুমাত্র একটি ছবি দিয়ে, এটি ব্যবহারকারীর প্রম্পটের উপর ভিত্তি করে কনট্রা এবং সুপার মারিও ব্রাদার্সের মতো সাইড-স্ক্রলিং 2D প্ল্যাটফর্ম তৈরি করতে পারে।

যাইহোক, গুগল ডিপমাইন্ড ঘোষণার সময় বলেছে যে এটি জেনি আকারে জেনারেটিভ কৃত্রিম বুদ্ধিমত্তার (এআই) জন্য একটি "নতুন দৃষ্টান্ত" প্রবর্তন করছে। উপরন্তু, কোম্পানি ভাষা, ছবি এবং এমনকি ভিডিওর মাধ্যমে উপন্যাস এবং সৃজনশীল বিষয়বস্তু তৈরি করতে সক্ষম জেনারেটিভ এআই মডেলের উত্থানের কথা স্বীকার করেছে।

Google-এর মতে, 200,000 ঘন্টার অনিয়ন্ত্রিত পাবলিক ইন্টারনেট গেমিং ভিডিওগুলির একটি উল্লেখযোগ্য অংশ যা জিনিকে প্রশিক্ষণ দেওয়া হয়েছিল সম্পূর্ণ ভার্চুয়াল রিয়েলিটি গেমের পরিবর্তে 2D প্ল্যাটফর্মার।

জিনি এর স্পেসিফিকেশন

যখন এটি মাত্রা আসে, জিনি 11 বিলিয়ন প্যারামিটারে দাঁড়িয়েছে। একটি স্প্যাটিওটেম্পোরাল ভিডিও টোকেনাইজার, একটি অটোরিগ্রেসিভ ডায়নামিক্স মডেল এবং একটি সহজ এবং মাপযোগ্য সুপ্ত অ্যাকশন মডেলও মডেলটিতে অন্তর্ভুক্ত করা হয়েছে। এই স্পেসিফিকেশনগুলি জেনিকে তৈরি করা পরিবেশে ফ্রেম-বাই-ফ্রেমে কাজ করতে সক্ষম করে, এমনকি প্রশিক্ষণের সময় লেবেল বা অন্যান্য ডোমেন-নির্দিষ্ট প্রয়োজনীয়তা ছাড়াই।

অতিরিক্তভাবে, জিনিকে শুধুমাত্র ভিডিও-ডেটাতে প্রশিক্ষণ দেওয়া সত্ত্বেও ইন্টারেক্টিভ এবং নিয়ন্ত্রণযোগ্য পরিবেশের একটি বৈচিত্র্যময় সেট তৈরি করার নির্দেশ দেওয়া যেতে পারে। জেনি শুধুমাত্র একটি ইমেজ প্রম্পট দিয়ে খেলার যোগ্য পরিবেশ তৈরি করতে পারে, অসংখ্য জেনারেটিভ এআই মডেলের বিপরীতে যা ভাষার ছবি এবং এমনকি ভিডিও সহ সৃজনশীল বিষয়বস্তু তৈরি করতে পারে।

যাইহোক, গুগল ডিপমাইন্ড ডেভেলপার টিম রকেটশেল X (আগের টুইটার) তে বলেছেন যে তারা প্রবর্তক পক্ষপাত যোগ করার পরিবর্তে স্কেলের উপর ফোকাস করে।

তিনি যোগ করেছেন যে তারা 200D প্ল্যাটফর্মার থেকে 2k ঘন্টার বেশি ভিডিওর ডেটাসেট ব্যবহার করে এবং একটি 11B বিশ্ব মডেলকে প্রশিক্ষণ দেয়। একটি তত্ত্বাবধানহীন উপায়ে, জিনি বিভিন্ন সুপ্ত ক্রিয়া শিখে যা ধারাবাহিকভাবে চরিত্রগুলিকে নিয়ন্ত্রণ করে।

একক ছবি থেকে Google এর Genie AI Crafts গেম
ফটো ক্রেডিট: গুগল

জিনি এর ক্ষমতা

অনুসারে গুগল গবেষকরা, জিনি তিনটি মডেল দ্বারা চালিত: একটি গতিশীল মডেল যা ভবিষ্যদ্বাণী করে যে পরবর্তী ফ্রেমে কী ঘটবে, একটি ভিডিও টোকেনাইজার যা কাঁচা ভিডিও ফ্রেমগুলিকে বিচ্ছিন্ন টোকেনে পরিণত করে এবং একটি সুপ্ত অ্যাকশন মডেল যা ভিডিও ফ্রেমের মধ্যে ক্রিয়াগুলি অনুমান করতে পারে৷

অ্যাকশন বা টেক্সট অ্যানোটেশনের প্রশিক্ষণ ছাড়াই গেমের প্রাথমিক চরিত্র শনাক্ত করার জন্য জিনির মৌলিক মডেলের ক্ষমতা হল এর অনন্য বৈশিষ্ট্যগুলির মধ্যে একটি। মডেলগুলিকে ধন্যবাদ যা এটি চালিত করে, ব্যবহারকারী অনায়াসে একটি চরিত্রটিকে নিয়ন্ত্রণ করতে পারে এআই-উত্পাদিত ভার্চুয়াল বাস্তবতা পরিবেশ।

Rocktäschel আরও বলেছিলেন যে জিনি অন্যান্য মিডিয়াকে গেমে পরিণত করতে পারে। জিনিকে Google DeepMind গবেষণাপত্রের বিভিন্ন ইনপুট থেকে বিভিন্ন অ্যাকশন-নিয়ন্ত্রণযোগ্য ভার্চুয়াল জগত তৈরি করতে বলা যেতে পারে।

উপরন্তু, Rocktäschel বলেছেন যে মডেলটি যেকোনো ছবিকে একটি খেলার যোগ্য 2D বিশ্বে রূপান্তর করতে পারে। তার মতে, জিনি মানুষের ডিজাইন করা সৃষ্টি যেমন স্কেচকে জীবন্ত করে তুলতে পারে, উদাহরণস্বরূপ, সেনেকা এবং কাস্পিয়ানের সুন্দর শিল্পকর্ম, বিশ্বের সর্বকনিষ্ঠ দুই নির্মাতা।

সময় স্ট্যাম্প:

থেকে আরো মেটানিউজ