گو پلےنگ اے آئی سسٹمز پر انسان جوابی حملہ کرتے ہیں۔

گو پلےنگ اے آئی سسٹمز پر انسان جوابی حملہ کرتے ہیں۔

Humans strike back at Go-playing AI systems PlatoBlockchain Data Intelligence. Vertical Search. Ai.

سوچیں کہ AI کے خلاف حکمت عملی کے کھیل کھیلتے وقت چھوٹے انسانوں کو موقع نہیں ملتا؟ آپ کو دوبارہ سوچنا پڑ سکتا ہے۔ امریکہ میں ایک شخص نے گو کے قدیم کھیل میں ایک AI کو صرف اس حملے سے ہٹا کر اسے شکست دی جو وہ کر رہا تھا، ایک ایسا حربہ جس کا کسی دوسرے میٹ بیگ پر کام کرنے کا امکان نہیں تھا۔

کھلاڑی، کیلن پیلرین، گو کھیلنے کے لیے شوقیہ رینکنگ میں بظاہر سرفہرست نہیں ہیں، لیکن 14 میں سے 15 گیمز میں AI کو بہترین بنانے میں کامیاب رہے، اس کے مطابق فنانشل ٹائمز. پیلرین نے ایسے حربے استعمال کیے جن میں بورڈ کے دوسرے کونوں میں حرکت کے ساتھ الگورتھم کو بھٹکانا شامل تھا جب کہ وہ اپنے مخالفین کے پتھروں کے گروہوں کو گھیرنے کے لیے کام کرتا تھا۔

گو ایک بورڈ گیم ہے جس میں دو کھلاڑی 19 x 19 بورڈ پر سیاہ یا سفید پتھر رکھتے ہیں، جس کا مقصد آپ کے حریف سے بڑے علاقے کو گھیرنا ہے۔ اگر مخالف پتھروں سے گھرا ہوا ہو تو بورڈ سے پتھر ہٹا دیئے جاتے ہیں۔

ایسا لگتا ہے کہ Go-playing AI نے اس مشکل کو محسوس نہیں کیا جو اس میں تھی، یہاں تک کہ جب گھیراؤ تقریبا مکمل ہو چکا تھا - ایک حکمت عملی جو کسی دوسرے انسانی کھلاڑی پر ایک نظر میں ظاہر ہو جاتی۔

یہ سب 2016 سے بہت دور کی بات ہے، جب گوگل کی ملکیت ڈیپ مائنڈز AlphaGo لی سیڈول کو شکست دینے میں کامیاب رہا – جو دنیا میں سب سے اونچے درجے کے Go پلیئرز میں سے ایک ہے – اور بہت سے لوگوں نے اس ترقی کو انسانی کھلاڑیوں کے لیے کھیل کے طور پر سمجھا کیوں کہ مستقبل میں ان کے ارد گرد مزید جدید ترین مشین لرننگ ماڈلز کے ذریعے رِنگز چلیں گے۔

Pelrine AlphaGo کے خلاف نہیں کھیل رہی تھی، بلکہ اس کے بجائے کئی دوسرے Go-playing AI سسٹمز کے خلاف کھیل رہی تھی، بشمول KataGo، جو AlphaGo Zero کی تخلیق میں ڈیپ مائنڈ کی استعمال کردہ تکنیکوں پر مبنی ہے۔

ستم ظریفی یہ ہے کہ ان AI سسٹمز کو شکست دینے کا طریقہ ایک کمپیوٹر پروگرام کے ذریعے دریافت کیا گیا تھا، جسے خاص طور پر محققین کی ایک ٹیم (بشمول پیلرین) نے AI حکمت عملی کی کمزوریوں کی تحقیقات کے لیے بنایا تھا جس سے ایک انسانی کھلاڑی فائدہ اٹھا سکتا ہے۔ ہمیں بتایا گیا ہے کہ اس پروگرام نے اپنے رویے کا تجزیہ کرنے کے لیے KataGo کے خلاف ایک ملین سے زیادہ گیمز کھیلے۔

پیلرین نے ایف ٹی کو بتایا کہ سافٹ ویئر کی طرف سے پائی جانے والی حکمت عملی مکمل طور پر معمولی نہیں ہے لیکن نہ ہی انسانی کھلاڑیوں کے لیے اس کی گرفت میں آنا مشکل ہے، اور اسے ایک انٹرمیڈیٹ کھلاڑی کے ذریعے گو پلےنگ اے آئی ماڈلز کو کامیابی سے شکست دینے کے لیے استعمال کیا جا سکتا ہے۔

تازہ ترین اقدام اس بات پر روشنی ڈالتا ہے کہ AI سسٹم کسی بھی عمل میں ماہر دکھائی دے سکتے ہیں جو ان کے ماڈل کو انجام دینے کے لیے تربیت دی گئی ہے، لیکن پھر بھی ان کی صلاحیتوں میں حیران کن سوراخ ہو سکتے ہیں۔

سافٹ ویئر انجینئر اور پیشہ ور شطرنج اور ذہن کے کھیل کے کھلاڑی ایلین ڈیکر نے بتایا کہ "میرے خیال میں 'حیران کن ناکامی کا موڈ' یہاں کی اصل کہانی ہے۔" رجسٹر. "ایک کے بارے میں سوچو ٹیسلا کار ایک وین کے پہلو میں جا رہی ہے۔ کیونکہ اس نے اسکائی لائن کے لیے اس کے ہلکے رنگ کو غلط سمجھا ہے۔

ڈیکر نے کہا کہ کسی بھی اعلیٰ تربیت یافتہ AI میں یہ اندھے دھبے ہونے کا امکان ہوتا ہے، کہ اندھے دھبوں کو ڈھانپنے کے لیے زیادہ سے زیادہ پیچیدگی کا اضافہ جزوی طور پر یہ ہے کہ اسے اچھی طرح سے کام کرنا اتنا مشکل کیوں ہے، اور ڈرائیور کے بغیر کاریں حاصل کرنے میں توقع سے زیادہ وقت کیوں لگ سکتا ہے۔ ہماری سڑکوں پر.

تحقیقی ٹیم نے ایف ٹی کو بتایا کہ اے آئی گو پلیئرز کی حکمت عملیوں میں بلائنڈ اسپاٹ کی اصل وجہ قیاس کی بات ہے، لیکن امکان ہے کہ پیلرین کی جانب سے استعمال کیا جانے والا طریقہ اتنا نایاب ہے کہ الگورتھم اسے تسلیم نہیں کرتا۔ اگر ایسا ہے تو، ایسا لگتا ہے کہ اس حکمت عملی کو پہچاننے کے لیے تربیت یافتہ جدید ماڈلز مستقبل میں اتنی آسانی سے بیوقوف نہیں بن سکتے۔

جیتنے والی حکمت عملی کو دریافت کرنے کے لیے استعمال کیے جانے والے مخالفانہ حربوں کی تفصیل دینے والا ایک مقالہ مل سکتا ہے۔ یہاں [PDF] ®

ٹائم اسٹیمپ:

سے زیادہ رجسٹر