একটি Google AI 30,000 ঘন্টা ভিডিও গেম দেখেছে—এখন এটি নিজের তৈরি করেছে

একটি Google AI 30,000 ঘন্টা ভিডিও গেম দেখেছে—এখন এটি নিজের তৈরি করেছে

একটি Google AI 30,000 ঘন্টার ভিডিও গেম দেখেছে—এখন এটি নিজস্ব PlatoBlockchain ডেটা বুদ্ধিমত্তা তৈরি করে৷ উল্লম্ব অনুসন্ধান. আ.

AI প্রচুর আলো এবং তাপ উৎপন্ন করে চলেছে। টেক্সট এবং ইমেজের সেরা মডেলগুলি—এখন সাবস্ক্রিপশনের কমান্ড দিচ্ছে এবং ভোক্তা পণ্যগুলিতে বোনা হচ্ছে—ইঞ্চিগুলির জন্য প্রতিদ্বন্দ্বিতা করছে৷ OpenAI, Google, এবং Anthropic সবই কমবেশি, ঘাড় ও ঘাড়।

এতে অবাক হওয়ার কিছু নেই যে AI গবেষকরা জেনারেটিভ মডেলগুলিকে নতুন অঞ্চলে ঠেলে দিতে চাইছেন। যেহেতু AI-এর জন্য প্রচুর পরিমাণে ডেটার প্রয়োজন হয়, সেহেতু পরবর্তী জিনিসগুলি কোথায় যাচ্ছে তা পূর্বাভাস দেওয়ার একটি উপায় হল অনলাইনে কোন ডেটা ব্যাপকভাবে পাওয়া যায়, কিন্তু এখনও অনেকাংশে ব্যবহার করা হয়নি।

ভিডিও, যার মধ্যে প্রচুর আছে, এটি একটি সুস্পষ্ট পরবর্তী পদক্ষেপ। প্রকৃতপক্ষে, গত মাসে, OpenAI পূর্বরূপ দেখেছিল সোরা নামে একটি নতুন টেক্সট-টু-ভিডিও AI যে স্তম্ভিত দর্শকদের.

কিন্তু ভিডিও...গেম সম্পর্কে কি?

জিজ্ঞাসা করুন এবং গ্রহণ করুন

দেখা যাচ্ছে অনলাইনে বেশ কয়েকটি গেমার ভিডিও রয়েছে। গুগল ডিপমাইন্ড বলেছে যে এটি 30,000 ঘন্টার কিউরেটেড ভিডিও ফুটেজে একটি নতুন এআই, জিনিকে প্রশিক্ষণ দিয়েছে যা গেমারদের সহজ প্ল্যাটফর্মার খেলতে দেখায়—মনে করুন প্রথম দিকের নিন্টেন্ডো গেমগুলি—এবং এখন এটি তার নিজস্ব উদাহরণ তৈরি করতে পারে.

জিনি একটি সাধারণ চিত্র, ফটো বা স্কেচকে একটি ইন্টারেক্টিভ ভিডিও গেমে পরিণত করে৷

একটি প্রম্পট দেওয়া হলে, একটি অক্ষর এবং তার চারপাশের একটি অঙ্কন বলুন, AI তারপরে একটি চরিত্রকে তার বিশ্বের মধ্যে স্থানান্তর করতে একজন খেলোয়াড়ের কাছ থেকে ইনপুট নিতে পারে। একটি ব্লগ পোস্টে, ডিপমাইন্ড জিনির সৃষ্টিগুলি 2D ল্যান্ডস্কেপ নেভিগেট করে, চারপাশে হাঁটা বা প্ল্যাটফর্মের মধ্যে ঝাঁপ দিয়ে দেখায়৷ একটি সাপ যেমন তার লেজ খাচ্ছে, এই বিশ্বের কিছু এমনকি AI-উত্পন্ন চিত্র থেকে উৎসারিত হয়েছে।

প্রথাগত ভিডিও গেমের বিপরীতে, জিনি এই ইন্টারেক্টিভ ওয়ার্ল্ডস ফ্রেম দ্বারা ফ্রেম তৈরি করে। সরানোর জন্য একটি প্রম্পট এবং কমান্ড দেওয়া হলে, এটি সম্ভবত পরবর্তী ফ্রেমগুলির পূর্বাভাস দেয় এবং সেগুলিকে উড়তে তৈরি করে৷ এমনকি এটি প্যারালাক্সের অনুভূতি অন্তর্ভুক্ত করতে শিখেছে, প্ল্যাটফর্মের একটি সাধারণ বৈশিষ্ট্য যেখানে অগ্রভাগ ব্যাকগ্রাউন্ডের চেয়ে দ্রুত চলে।

উল্লেখযোগ্যভাবে, এআই-এর প্রশিক্ষণে লেবেল অন্তর্ভুক্ত ছিল না। বরং, জিনি ইনপুট কমান্ডগুলিকে পারস্পরিক সম্পর্ক স্থাপন করতে শিখেছে—যেমন, বামদিকে যান, ডানে যান বা লাফিয়ে দেন--এর প্রশিক্ষণে উদাহরণগুলি পর্যবেক্ষণ করে ইন-গেম মুভমেন্টের সাথে। অর্থাৎ, যখন একটি ভিডিওর একটি অক্ষর বাম দিকে সরে যায়, তখন মোশনের সাথে কমান্ড লিঙ্ক করার কোনো লেবেল ছিল না। জিনি নিজেই সেই অংশটি বের করেছিল। এর মানে, সম্ভাব্যভাবে, ভবিষ্যতের সংস্করণগুলি অনলাইনে যতটা প্রযোজ্য ভিডিওতে প্রশিক্ষিত হতে পারে।

এআই ধারণার একটি চিত্তাকর্ষক প্রমাণ, তবে এটি এখনও বিকাশের খুব প্রাথমিক পর্যায়ে রয়েছে এবং ডিপমাইন্ড এখনও মডেলটিকে সর্বজনীন করার পরিকল্পনা করছে না।

গেমগুলি নিজেই পিক্সেলেড ওয়ার্ল্ডস যা প্রতি সেকেন্ডে এক ফ্রেমে স্ট্রিমিং করে। তুলনা করে, সমসাময়িক ভিডিও গেম প্রতি সেকেন্ডে 60 বা 120 ফ্রেম হিট করতে পারে। এছাড়াও, সমস্ত জেনারেটিভ অ্যালগরিদমের মতো, জিনি অদ্ভুত বা অসংলগ্ন ভিজ্যুয়াল আর্টিফ্যাক্ট তৈরি করে। এটি "অবাস্তব ভবিষ্যত" হ্যালুসিনেটিং প্রবণ দলটি তাদের কাগজে এআই বর্ণনা করে লিখেছে.

এটি বলেছিল, জিনি এখান থেকে উন্নতি করবে বিশ্বাস করার কয়েকটি কারণ রয়েছে।

আপ ওয়ার্ল্ডস চাবুক

কারণ AI লেবেলবিহীন অনলাইন ভিডিওগুলি থেকে শিখতে পারে এবং এখনও একটি শালীন আকার—মাত্র 11 বিলিয়ন প্যারামিটার—এখানে স্কেল করার যথেষ্ট সুযোগ রয়েছে৷ আরও তথ্যের উপর প্রশিক্ষিত বড় মডেলগুলি নাটকীয়ভাবে উন্নতি করতে থাকে। এবং সঙ্গে a ক্রমবর্ধমান শিল্প অনুমানের উপর দৃষ্টি নিবদ্ধ করে—যে প্রক্রিয়াটির মাধ্যমে একটি প্রশিক্ষিত AI কাজগুলি সম্পাদন করে, যেমন ছবি বা টেক্সট তৈরি করা—এটি দ্রুততর হওয়ার সম্ভাবনা রয়েছে৷

ডিপমাইন্ড বলেছেন যে জিনি পেশাদার বিকাশকারীদের মতো ভিডিও গেম তৈরি করতে সহায়তা করতে পারে। কিন্তু ওপেনএআই-এর মতো-যা বিশ্বাস করে সোরা ভিডিওর চেয়ে বেশি কিছু-টিম বড় চিন্তা করছে। পদ্ধতিটি ভিডিও গেমের বাইরেও যেতে পারে।

একটি উদাহরণ: AI যা রোবটকে নিয়ন্ত্রণ করতে পারে. দলটি বিভিন্ন কাজ সম্পন্ন করার জন্য রোবটিক অস্ত্রের ভিডিওতে একটি পৃথক মডেলের প্রশিক্ষণ দিয়েছে। মডেলটি রোবটগুলিকে ম্যানিপুলেট করতে এবং বিভিন্ন ধরণের বস্তু পরিচালনা করতে শিখেছিল।

ডিপমাইন্ড আরও বলেছে যে জিনি-উত্পাদিত ভিডিও গেম পরিবেশগুলি এআই এজেন্টদের প্রশিক্ষণের জন্য ব্যবহার করা যেতে পারে। এটা নতুন কোনো কৌশল নয়। একটি 2021 পেপারে, আরেকটি ডিপমাইন্ড টিম XLand নামে একটি ভিডিও গেমের রূপরেখা দিয়েছে যেটি এআই এজেন্ট এবং একটি এআই ওভারলর্ড তাদের চ্যালেঞ্জ করার জন্য কাজ এবং গেম তৈরি করে। ধারণা যে AI এর পরবর্তী বড় পদক্ষেপের জন্য অ্যালগরিদমের প্রয়োজন হবে যা একে অপরকে প্রশিক্ষণ দিতে পারে বা সিন্থেটিক প্রশিক্ষণ ডেটা তৈরি করতে পারে আকর্ষণ অর্জন.

এআই-তে অগ্রগতি দেখানোর জন্য ওপেনএআই এবং গুগলের মধ্যে একটি তীব্র প্রতিযোগিতায় এই সবই সর্বশেষ সলভো। মাঠে অন্যরা যখন, নৃতাত্ত্বিক মত, GPT-4 এর অনুরূপ মাল্টিমোডাল মডেলগুলিকে অগ্রসর করছে, Google এবং OpenAI এছাড়াও অ্যালগরিদমগুলির উপর দৃষ্টি নিবদ্ধ করে যা বিশ্বকে অনুকরণ করে৷ এই ধরনের অ্যালগরিদম পরিকল্পনা এবং মিথস্ক্রিয়াতে আরও ভাল হতে পারে। এআই এজেন্টদের জন্য উভয়ই গুরুত্বপূর্ণ দক্ষতা হবে উভয় প্রতিষ্ঠানই উৎপাদনে অভিপ্রায় বলে মনে হয়।

"জিনিকে আগে কখনো দেখা যায়নি এমন চিত্র দিয়ে প্ররোচিত করা যেতে পারে, যেমন বাস্তব বিশ্বের ফটোগ্রাফ বা স্কেচ, যা মানুষকে তাদের কল্পনা করা ভার্চুয়াল জগতের সাথে যোগাযোগ করতে সক্ষম করে - মূলত একটি ভিত্তি বিশ্বের মডেল হিসাবে কাজ করে," গবেষকরা লিখেছেন জিনি ব্লগ পোস্ট. “আমরা ফোকাস করি 2D প্ল্যাটফর্মার গেমস এবং রোবোটিক্সের ভিডিও কিন্তু আমাদের পদ্ধতিটি সাধারণ এবং যেকোনো ধরনের ডোমেনের জন্য কাজ করা উচিত, এবং আরও বড় ইন্টারনেট ডেটাসেটের জন্য মাপযোগ্য।"

একইভাবে, যখন ওপেনএআই গত মাসে সোরার পূর্বরূপ দেখেছিল, গবেষকরা পরামর্শ দিয়েছিলেন যে এটি আরও ভিত্তিমূলক কিছু হতে পারে: একটি বিশ্ব সিমুলেটর। অর্থাৎ, উভয় দলই অনলাইন ভিডিওর বিশাল ক্যাশেকে AI-এর নিজস্ব ভিডিও তৈরি করার জন্য প্রশিক্ষণের উপায় হিসেবে দেখে বলে মনে হচ্ছে, হ্যাঁ, তবে আরও কার্যকরভাবে বোঝার জন্য এবং অনলাইনে বা অফ-অফ বিশ্বে কাজ করার জন্য।

এটি লভ্যাংশ প্রদান করে, নাকি দীর্ঘমেয়াদী টেকসই, এটি একটি উন্মুক্ত প্রশ্ন। মানুষের মস্তিষ্ক একটি আলোর বাল্বের শক্তির উপর কাজ করে; জেনারেটিভ এআই পুরো ডেটা সেন্টার ব্যবহার করে। কিন্তু প্রতিভা, প্রযুক্তি, মস্তিস্ক এবং নগদ অর্থের পরিপ্রেক্ষিতে এই মুহূর্তে খেলার শক্তিগুলোকে অবমূল্যায়ন না করাই ভালো- যার লক্ষ্য শুধু AI উন্নত করা নয় বরং এটিকে আরও দক্ষ করে তোলা।

আমরা টেক্সট, ইমেজ, অডিও, এবং তিনটি একসাথে চিত্তাকর্ষক অগ্রগতি দেখেছি। ভিডিওগুলি হল পরবর্তী উপাদান যা পাত্রে নিক্ষেপ করা হচ্ছে এবং সেগুলি আরও শক্তিশালী চোলাই তৈরি করতে পারে৷

চিত্র ক্রেডিট: গুগল ডিপমিন্ড

সময় স্ট্যাম্প:

থেকে আরো এককতা হাব