মেটার নতুন এআই গেম 'কূটনীতি'-এ শীর্ষ 10%-এ স্থান পেয়েছে—এবং মানব খেলোয়াড়রা বুদ্ধিমান প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্স নয়। উল্লম্ব অনুসন্ধান. আ.

মেটার নতুন এআই 'কূটনীতি' গেমে শীর্ষ 10%-এ স্থান পেয়েছে—এবং মানব খেলোয়াড়রা কেউই বুদ্ধিমান ছিল না

AI সবচেয়ে বেশি কিছু আয়ত্ত করেছে জটিল গেম মানুষের কাছে পরিচিত, কিন্তু যখন এটি প্রায়শই প্রতিযোগিতায় উৎকৃষ্ট হয়, সহযোগিতা ততটা স্বাভাবিকভাবে আসে না। এখন মেটা থেকে একটি এআই কূটনীতি গেমটিতে দক্ষতা অর্জন করেছে, যার জন্য আপনাকে জয়ের জন্য অন্যান্য খেলোয়াড়দের সাথে কাজ করতে হবে।

গুগল এর আয়ত্ত গো গেম AI-এর জন্য একটি প্রধান মাইলফলক হিসাবে সমাদৃত হয়েছিল, কিন্তু এর অনস্বীকার্য জটিলতা সত্ত্বেও, এটি অনেক উপায়ে ঠান্ডার জন্য উপযুক্ত, একটি মেশিনের যুক্তি গণনা করা। এটি একটি নিখুঁত তথ্যের খেলা, যেখানে আপনি আপনার প্রতিপক্ষের চালগুলির সম্পূর্ণ দৃশ্যমানতা পান এবং জয়লাভের অর্থ হল অন্য একজন খেলোয়াড়কে ছাড়িয়ে যেতে সক্ষম হওয়া।

অন্যদিকে, কূটনীতি অনেক বেশি অগোছালো ব্যাপার। বোর্ড গেমটি সাতজন পর্যন্ত খেলোয়াড় নিতে দেখে শেষ ইউরোপীয় সামরিক শক্তি এবং কৌশলগত শহরগুলির নিয়ন্ত্রণ নিতে তাদের সেনাবাহিনী ব্যবহার করে। কিন্তু খেলোয়াড়দের পূর্ণ আধিপত্য অর্জনের জন্য জোট গঠন ও ভাঙতে একে অপরের সাথে আলোচনা করার অনুমতি দেওয়া হয়।

আরও কী, সমস্ত খেলোয়াড়ের চালগুলি প্রতিটি মোড়ের সাথে একযোগে তৈরি করা হয়, তাই আপনি অন্যরা যা করে তাতে প্রতিক্রিয়া জানাতে পারবেন না। এর মানে হল যে গেম জেতার জন্য কৌশলগত চিন্তাভাবনা, অন্যান্য খেলোয়াড়দের সাথে সহযোগিতা করার ক্ষমতা এবং প্ররোচনামূলক আলোচনার দক্ষতার একটি জটিল সমন্বয় প্রয়োজন। যদিও AI ইতিমধ্যেই বিশুদ্ধ কৌশল আয়ত্ত করেছে, সেই অন্যান্য দক্ষতাগুলি প্রতিলিপি করা আরও জটিল প্রমাণিত হয়েছে।

মেটার গবেষকদের দ্বারা ডিজাইন করা একটি নতুন AI সেই দিকে একটি বড় পদক্ষেপ নিতে পারে। ক কাগজ প্রকাশিত গত সপ্তাহে in বিজ্ঞান, তারা সিসেরো নামক একটি সিস্টেমের বর্ণনা দেয় যা একটি অনলাইন ডিপ্লোমেসি লিগে শীর্ষ 10 শতাংশ খেলোয়াড়ের মধ্যে স্থান করে এবং মানব খেলোয়াড়দের গড় স্কোর দ্বিগুণেরও বেশি অর্জন করে।

"সিসেরো স্থিতিস্থাপক, এটি নির্মম এবং এটি ধৈর্যশীল,” তিনবারের কূটনীতি বিশ্ব চ্যাম্পিয়ন অ্যান্ড্রু গফ বলেছেনid একটি ভিডিও মেটা দ্বারা উত্পাদিত. “এটি প্রচুর মানবিক আবেগ ছাড়াই খেলে যা কখনও কখনও আপনাকে খারাপ সিদ্ধান্ত নিতে বাধ্য করে। এটি কেবল পরিস্থিতির মূল্যায়ন করে এবং সর্বোত্তম সিদ্ধান্ত নেয়, শুধুমাত্র এটির জন্য নয়, এটি যাদের সাথে কাজ করছে তাদের জন্য।"

সিসেরো তৈরি করার জন্য মেটা গবেষকদের দুটি ভিন্ন উপ-ক্ষেত্র থেকে অত্যাধুনিক এআই পদ্ধতি একত্রিত করতে হবে: কৌশলগত যুক্তি এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণ। এর হৃদয়ে, সিস্টেমের একটি পরিকল্পনা অ্যালগরিদম রয়েছে যা অন্যান্য খেলোয়াড়দের পদক্ষেপের পূর্বাভাস দেয় এবং এটি তার নিজস্ব কৌশল নির্ধারণ করতে ব্যবহার করে। এই অ্যালগরিদমটি AI-কে বারবার নিজেকে খেলার জন্য প্রশিক্ষিত করা হয়েছিল, পাশাপাশি মানুষ যেভাবে গেম খেলে তা অনুকরণ করার চেষ্টা করে।

গবেষকরা ইতিমধ্যে দেখিয়েছেন যে এই পরিকল্পনা মডিউল একাই সক্ষম ছিল মানুষের পেশাদারদের বীট গেমের একটি সরলীকৃত সংস্করণে। কিন্তু এই সর্বশেষ গবেষণায়, দলটি এটিকে ইন্টারনেট থেকে প্রচুর পরিমাণে পাঠ্যের উপর প্রশিক্ষিত একটি বৃহৎ ভাষার মডেলের সাথে একত্রিত করেছে, এবং তারপর কূটনীতির 40,000টি অনলাইন গেম থেকে সংলাপ ব্যবহার করে সূক্ষ্ম-টিউন করেছে। এটি আপগ্রেড করা সিসেরোকে অন্যান্য খেলোয়াড়ের বার্তাগুলিকে ব্যাখ্যা করার ক্ষমতা দিয়েছে এবং এছাড়াও তার নিজস্ব নৈপুণ্য বার্তা তাদের একসাথে কাজ করতে রাজি করানো।

সম্মিলিত সিস্টেমটি বোর্ডের বর্তমান অবস্থা এবং অতীতের সংলাপ ব্যবহার করে প্রতিটি খেলোয়াড়ের কী করার সম্ভাবনা রয়েছে তা অনুমান করে শুরু হয়। এটি তার উদ্দেশ্য রূপরেখা এবং অন্যান্য খেলোয়াড়দের সহযোগিতা নিশ্চিত করার জন্য ডিজাইন করা বার্তা তৈরি করার আগে নিজের এবং তার অংশীদারদের উভয়ের জন্য একটি কর্ম পরিকল্পনা নিয়ে আসে।

অনলাইন টুর্নামেন্টে 40 টিরও বেশি গেম, সিসেরো কার্যকরভাবে 82 জন খেলোয়াড়ের সাথে তার উদ্দেশ্য ব্যাখ্যা করতে, কর্মের সমন্বয় সাধন এবং জোটের আলোচনার জন্য যোগাযোগ করেছিল। গুরুত্বপূর্ণভাবে, গবেষকরা বলছেন যে তারা গেমের বার্তাগুলি থেকে কোনও প্রমাণ দেখেননি যে মানব খেলোয়াড়রা সন্দেহ করেছে যে তারা একটি AI এর সাথে দলবদ্ধ হয়েছে।

যাইহোক, মডেলের যোগাযোগের ক্ষমতা ত্রুটিহীন ছিল না। এটি অযৌক্তিক বার্তাগুলি বা এর লক্ষ্যগুলির সাথে অসঙ্গতিপূর্ণ থুথু ফেলতে সক্ষম, তাই গবেষকদের প্রতিটি পদক্ষেপে একাধিক প্রার্থী বার্তা তৈরি করতে হয়েছিল এবং তারপর আবর্জনা আগাছা করার জন্য বিভিন্ন ফিল্টারিং প্রক্রিয়া ব্যবহার করতে হয়েছিল। এবং তারপরেও, গবেষকরা স্বীকার করেন যে অযৌক্তিক বার্তাগুলি কখনও কখনও পিছলে যায়PED মাধ্যমে।

এটি পরামর্শ দেয় যে সিসেরোর কেন্দ্রস্থলে থাকা ভাষা মডেলটি এখনও সত্যিই বুঝতে পারে না যে কী চলছে এবং কেবল প্রশংসনীয়-শব্দযুক্ত বার্তাগুলি তৈরি করছে যা তারপরে তারা পছন্দসই ফলাফল অর্জন করেছে তা নিশ্চিত করার জন্য যাচাই করা দরকার।

লেখার মধ্যে কথোপকথোন, অস্ট্রেলিয়ার নিউ সাউথ ওয়েলস বিশ্ববিদ্যালয়ের এআই গবেষক টবি ওয়ালশ আরও উল্লেখ করেছেন যে সিসেরো বেশিরভাগ মানব খেলোয়াড়ের বিপরীতে অযৌক্তিকভাবে সৎ। যদিও এটি একটি আশ্চর্যজনকভাবে কার্যকর কৌশল, এটি একটি বড় দুর্বলতা হতে পারে যদি প্রতিযোগীরা কাজ করে যে তাদের প্রতিপক্ষ কখনোই তাদের প্রতারণা করার চেষ্টা করবে না।

অগ্রিম একটি উল্লেখযোগ্য একটি, তথাপি, এবং Facebook আশা করে যে এটি বোর্ড গেমের বাইরেও অ্যাপ্লিকেশন থাকতে পারে। একটি ব্লগ পোস্টে, গবেষকরা বলছেন যে ভাষা তৈরির নিয়ন্ত্রণ করার জন্য পরিকল্পনা অ্যালগরিদম ব্যবহার করার ক্ষমতা AI চ্যাটবটগুলির সাথে অনেক দীর্ঘ এবং সমৃদ্ধ কথোপকথন করা বা ভিডিও গেমের চরিত্রগুলি তৈরি করা সম্ভব করে তোলে যারা একজন খেলোয়াড়ের আচরণের সাথে খাপ খাইয়ে নিতে পারে।

চিত্র ক্রেডিট: MabelAmber / 4008 ছবি

সময় স্ট্যাম্প:

থেকে আরো এককতা হাব