Meta's New AI گیم 'ڈپلومیسی' میں سرفہرست 10% میں درجہ بندی کرتا ہے — اور انسانی کھلاڑی کوئی بھی سمجھدار پلیٹو بلاکچین ڈیٹا انٹیلی جنس نہیں تھے۔ عمودی تلاش۔ عی

Meta's New AI کو گیم 'ڈپلومیسی' میں ٹاپ 10% میں درجہ دیا گیا — اور انسانی کھلاڑی اس سے زیادہ عقلمند نہیں تھے۔

AI نے سب سے زیادہ مہارت حاصل کی ہے۔ پیچیدہ کھیل انسان کو معلوم ہے، لیکن جب کہ یہ اکثر مقابلے میں سبقت لے جاتا ہے، تعاون قدرتی طور پر نہیں آتا۔ اب میٹا کے ایک AI نے گیم ڈپلومیسی میں مہارت حاصل کر لی ہے، جس میں جیتنے کے لیے آپ کو دوسرے کھلاڑیوں کے ساتھ کام کرنے کی ضرورت ہے۔

گوگل کی مہارت گو کا کھیل اسے AI کے لیے ایک اہم سنگ میل کے طور پر سراہا گیا، لیکن اس کی ناقابل تردید پیچیدگی کے باوجود، یہ بہت سے طریقوں سے سردی کے لیے موزوں ہے، ایک مشین کی منطق کے حساب سے۔ یہ کامل معلومات کا کھیل ہے، جہاں آپ کو اپنے حریف کی چالوں کی مکمل نمائش ہوتی ہے، اور جیتنے کا مطلب صرف ایک دوسرے کھلاڑی کو پیچھے چھوڑنا ہے۔

دوسری طرف، سفارت کاری ایک بہت زیادہ گندا معاملہ ہے۔ بورڈ گیم میں سات تک کھلاڑی شامل ہوتے ہیں۔ پر یورپی فوجی طاقتیں اور اپنی فوجوں کو اسٹریٹجک شہروں کا کنٹرول سنبھالنے کے لیے استعمال کرتی ہیں۔ لیکن کھلاڑیوں کو مکمل تسلط کے حصول میں اتحاد بنانے اور توڑنے کے لیے ایک دوسرے کے ساتھ گفت و شنید کرنے کی اجازت ہے۔

مزید یہ کہ، تمام کھلاڑیوں کی چالیں ہر موڑ پر ایک ساتھ کی جاتی ہیں، اس لیے آپ محض دوسروں کے کیے پر ردعمل ظاہر نہیں کر سکتے۔ اس کا مطلب ہے کہ گیمز جیتنے کے لیے اسٹریٹجک سوچ، دوسرے کھلاڑیوں کے ساتھ تعاون کرنے کی صلاحیت، اور قائل گفت و شنید کی مہارت کے پیچیدہ امتزاج کی ضرورت ہوتی ہے۔ اگرچہ AI پہلے ہی خالص حکمت عملی میں مہارت حاصل کر چکا ہے، لیکن وہ دوسری مہارتیں نقل کرنے کے لیے بہت زیادہ مشکل ثابت ہوئی ہیں۔

میٹا کے محققین کے ذریعہ ڈیزائن کیا گیا ایک نیا AI اس سمت میں ایک بڑا قدم اٹھا سکتا ہے۔ ایک ___ میں کاغذ شائع گزشتہ ہفتے in سائنس, وہ Cicero نامی ایک نظام کی وضاحت کرتے ہیں جو آن لائن ڈپلومیسی لیگ میں سب سے اوپر 10 فیصد کھلاڑیوں میں شامل ہے اور اس نے انسانی کھلاڑیوں کے اوسط سے دوگنا اسکور حاصل کیا ہے۔

"سیسرو لچکدار ہے، یہ بے رحم ہے، اور یہ صبر آزما ہے،" تین بار ڈپلومیسی کے عالمی چیمپئن اینڈریو گوف نے کہا۔id میں میٹا کے ذریعہ تیار کردہ ویڈیو. "یہ بہت سارے انسانی جذبات کے بغیر کھیلتا ہے جو کبھی کبھی آپ کو غلط فیصلے کرنے پر مجبور کرتا ہے۔ یہ صرف صورت حال کا جائزہ لیتا ہے اور نہ صرف اس کے لیے بلکہ ان لوگوں کے لیے بھی بہترین فیصلہ کرتا ہے جن کے ساتھ یہ کام کر رہا ہے۔

Cicero بنانے کے لیے میٹا محققین کو دو مختلف ذیلی شعبوں سے جدید ترین AI طریقوں کو یکجا کرنے کی ضرورت ہے: اسٹریٹجک استدلال اور قدرتی زبان کی پروسیسنگ۔ اس کے دل میں، نظام میں ایک منصوبہ بندی الگورتھم ہے جو دوسرے کھلاڑیوں کی چالوں کی پیش گوئی کرتا ہے اور اسے اپنی حکمت عملی کا تعین کرنے کے لیے استعمال کرتا ہے۔ یہ الگورتھم AI کو خود کو بار بار کھیلنے کے لیے تیار کر کے تربیت دی گئی تھی، جبکہ انسانوں کے گیم کھیلنے کے طریقے کی نقل کرنے کی بھی کوشش کی گئی تھی۔

محققین نے پہلے ہی دکھایا تھا کہ یہ منصوبہ بندی ماڈیول اکیلے کرنے کے قابل تھا۔ انسانی پیشہ کو شکست دی گیم کے آسان ورژن میں۔ لیکن اس تازہ ترین تحقیق میں، ٹیم نے اسے ایک بڑے لینگویج ماڈل کے ساتھ ملایا جو انٹرنیٹ سے متن کی بڑی مقدار پر تربیت یافتہ تھا، اور پھر ڈپلومیسی کے 40,000 آن لائن گیمز سے ڈائیلاگ کا استعمال کرتے ہوئے اسے ٹھیک بنایا گیا۔ اس نے اپ گریڈ شدہ Cicero کو دوسرے کھلاڑیوں کے پیغامات کی ترجمانی کرنے کی صلاحیت فراہم کی۔ اور خود بھی تیار کرتا ہے۔ پیغامات انہیں اکٹھے کام کرنے پر آمادہ کرنا۔

مشترکہ نظام بورڈ کی موجودہ حالت اور ماضی کے مکالمے کا استعمال کرتے ہوئے یہ اندازہ لگانے کے لیے شروع ہوتا ہے کہ ہر کھلاڑی کے کیا کرنے کا امکان ہے۔ اس کے بعد یہ اپنے اور اپنے شراکت داروں دونوں کے لیے ایکشن پلان کے ساتھ آتا ہے اس سے پہلے کہ اس کے ارادے کا خاکہ بنانے اور دوسرے کھلاڑیوں کے تعاون کو یقینی بنانے کے لیے بنائے گئے پیغامات تیار کیے جائیں۔

آن لائن ٹورنامنٹ میں 40 سے زیادہ گیمز، Cicero نے اپنے ارادوں کی وضاحت کرنے، کارروائیوں کو مربوط کرنے اور اتحاد پر گفت و شنید کرنے کے لیے 82 دیگر کھلاڑیوں کے ساتھ مؤثر طریقے سے بات چیت کی۔ اہم بات یہ ہے کہ محققین کا کہنا ہے کہ انہوں نے گیم کے اندر موجود پیغامات سے کوئی ثبوت نہیں دیکھا کہ انسانی کھلاڑیوں کو شبہ ہے کہ وہ AI کے ساتھ مل کر کام کر رہے ہیں۔

تاہم، ماڈل کی بات چیت کی صلاحیتیں بے عیب نہیں تھیں۔ یہ بے ہودہ پیغامات یا اپنے اہداف سے متضاد پیغامات کو تھوکنے کی صلاحیت سے کہیں زیادہ ہے، لہذا محققین کو ہر اقدام پر امیدواروں کے متعدد پیغامات تیار کرنے پڑتے ہیں اور پھر کوڑے کو باہر نکالنے کے لیے مختلف فلٹرنگ میکانزم کا استعمال کرنا پڑتا ہے۔ اور پھر بھی، محققین تسلیم کرتے ہیں کہ بعض اوقات غیر منطقی پیغامات پھسل جاتے ہیں۔پیڈ کے ذریعے

اس سے پتہ چلتا ہے کہ Cicero کے دل میں زبان کا ماڈل اب بھی واقعی سمجھ نہیں پا رہا ہے کہ کیا ہو رہا ہے اور وہ صرف قابل فہم آواز والے پیغامات تیار کر رہا ہے جس کے بعد اس بات کو یقینی بنانے کے لیے جانچ پڑتال کی ضرورت ہے کہ وہ مطلوبہ نتائج حاصل کرتے ہیں۔

میں لکھنا گفتگو, آسٹریلیا میں یونیورسٹی آف نیو ساؤتھ ویلز میں اے آئی کے محقق ٹوبی والش نے بھی نوٹ کیا کہ سیسیرو زیادہ تر انسانی کھلاڑیوں کے برعکس غیرجانبداری سے ایماندار ہے۔ اگرچہ یہ ایک حیرت انگیز طور پر موثر حکمت عملی ہے، لیکن یہ ایک بڑی کمزوری ہو سکتی ہے اگر حریف یہ سوچیں کہ ان کا مخالف کبھی بھی انہیں دھوکہ دینے کی کوشش نہیں کرے گا۔

بہر حال، پیشگی ایک اہم ہے، اور فیس بک کو امید ہے کہ اس کے پاس بورڈ گیمز سے کہیں زیادہ ایپلی کیشنز ہوسکتی ہیں۔ بلاگ پوسٹ میںمحققین کا کہنا ہے کہ زبان کی تخلیق کو کنٹرول کرنے کے لیے منصوبہ بندی کے الگورتھم استعمال کرنے کی صلاحیت AI چیٹ بوٹس کے ساتھ زیادہ طویل اور بھرپور بات چیت کرنے یا ویڈیو گیم کے کردار تخلیق کرنے کو ممکن بنا سکتی ہے جو کسی کھلاڑی کے رویے کو اپنا سکیں۔

تصویری کریڈٹ: میبل ایمبر / 4008 تصاویر

ٹائم اسٹیمپ:

سے زیادہ یکسانیت مرکز