یہ ڈیپ مائنڈ AI تیزی سے انسانوں کو دیکھ کر نئی مہارتیں سیکھتا ہے۔

یہ ڈیپ مائنڈ AI تیزی سے انسانوں کو دیکھ کر نئی مہارتیں سیکھتا ہے۔

یہ ڈیپ مائنڈ AI تیزی سے نئے ہنر سیکھتا ہے صرف انسانوں کے پلیٹو بلاکچین ڈیٹا انٹیلی جنس کو دیکھ کر۔ عمودی تلاش۔ عی

انسانوں کی نقل کرنے کے لیے الگورتھم سکھانے کے لیے عام طور پر سینکڑوں یا ہزاروں مثالوں کی ضرورت ہوتی ہے۔ لیکن گوگل ڈیپ مائنڈ کا ایک نیا AI پرواز پر انسانی مظاہرین سے نئی مہارتیں اٹھا سکتا ہے۔

انسانیت کی سب سے بڑی چالوں میں سے ایک ہماری ایک دوسرے سے تیزی سے اور مؤثر طریقے سے علم حاصل کرنے کی صلاحیت ہے۔ اس قسم کی سماجی تعلیم، جسے اکثر کلچرل ٹرانسمیشن کہا جاتا ہے، وہ ہے جو ہمیں اپنے ساتھی کو یہ دکھانے کی اجازت دیتی ہے کہ نیا ٹول کیسے استعمال کیا جائے یا اپنے بچوں کو نرسری کی نظمیں سکھائی جائیں۔

یہ کوئی تعجب کی بات نہیں ہے کہ محققین نے مشینوں میں اس عمل کو نقل کرنے کی کوشش کی ہے۔ مشابہت سیکھنا، جس میں AI کسی انسان کو ایک کام مکمل کرتے ہوئے دیکھتا ہے اور پھر ان کے رویے کی نقل کرنے کی کوشش کرتا ہے، روبوٹس کی تربیت کے لیے طویل عرصے سے ایک مقبول طریقہ رہا ہے۔ لیکن یہاں تک کہ آج کے جدید ترین ڈیپ لرننگ الگورتھم کو عام طور پر بہت سی مثالیں دیکھنے کی ضرورت ہوتی ہے اس سے پہلے کہ وہ اپنے ٹرینرز کو کامیابی سے کاپی کر سکیں۔

جب انسان تقلید کے ذریعے سیکھتے ہیں، تو وہ اکثر مٹھی بھر مظاہروں کے بعد نئے کام اٹھا سکتے ہیں۔ اب، گوگل ڈیپ مائنڈ کے محققین نے ایسے ایجنٹوں کے ساتھ AI میں تیز رفتار سماجی سیکھنے کی طرف ایک قدم اٹھایا ہے جو حقیقی وقت میں انسانوں سے ایک ورچوئل دنیا کو نیویگیٹ کرنا سیکھتے ہیں۔

"ہمارے ایجنٹ پہلے سے جمع کیے گئے انسانی ڈیٹا کا استعمال کیے بغیر ناول کے سیاق و سباق میں انسان کی حقیقی وقت میں تقلید کرنے میں کامیاب ہوتے ہیں،" محققین لکھتے ہیں۔ کاغذ میں فطرت، قدرت مواصلات. "ہم ثقافتی ترسیل پیدا کرنے کے لیے کافی اجزاء کے ایک حیرت انگیز طور پر سادہ سیٹ کی نشاندہی کرتے ہیں۔

محققین نے اپنے ایجنٹوں کو خاص طور پر ڈیزائن کردہ سمیلیٹر میں تربیت دی جسے GoalCycle3D کہتے ہیں۔ سمیلیٹر مختلف ماحول کی تقریباً لامتناہی تعداد پیدا کرنے کے لیے ایک الگورتھم کا استعمال کرتا ہے جس کی بنیاد اصولوں کی بنیاد پر کہ تخروپن کو کیسے کام کرنا چاہیے اور اس کے کن پہلوؤں کو مختلف ہونا چاہیے۔

ہر ماحول میں، چھوٹے بلاب کی طرح اے اے ایجنٹ ایک مخصوص ترتیب میں رنگین دائروں کی ایک سیریز سے گزرنے کے لیے ناہموار خطوں اور مختلف رکاوٹوں کو نیویگیٹ کرنا چاہیے۔ خطوں کا گہرا پن، رکاوٹوں کی کثافت، اور دائروں کی ترتیب ماحول کے درمیان مختلف ہوتی ہے۔

ایجنٹوں کو استعمال کرتے ہوئے تشریف لے جانے کی تربیت دی جاتی ہے۔ قابو پانے کی تعلیم. وہ صحیح ترتیب میں دائروں سے گزرنے پر انعام حاصل کرتے ہیں اور اس سگنل کو کئی آزمائشوں میں اپنی کارکردگی کو بہتر بنانے کے لیے استعمال کرتے ہیں۔ لیکن اس کے علاوہ، ماحولیات میں ایک ماہر ایجنٹ بھی ہوتا ہے—جو یا تو سخت کوڈڈ ہوتا ہے یا انسان کے زیر کنٹرول ہوتا ہے—جو کورس کے ذریعے صحیح راستہ جانتا ہے۔

بہت سے ٹریننگ کے دوران، AI ایجنٹ نہ صرف بنیادی باتیں سیکھتے ہیں کہ ماحول کیسے کام کرتا ہے، بلکہ یہ بھی کہ ہر مسئلے کو حل کرنے کا تیز ترین طریقہ ماہر کی نقل کرنا ہے۔ اس بات کو یقینی بنانے کے لیے کہ ایجنٹ کورسز کو حفظ کرنے کے بجائے نقل کرنا سیکھ رہے ہیں، ٹیم نے انہیں ماحول کے ایک سیٹ پر تربیت دی اور پھر دوسرے پر ان کا تجربہ کیا۔ اہم بات یہ ہے کہ تربیت کے بعد، ٹیم نے دکھایا کہ ان کے ایجنٹ ایک ماہر کی نقل کر سکتے ہیں اور ماہر کے بغیر بھی اس راستے پر چلتے رہ سکتے ہیں۔

اس کے لیے معیاری کمک سیکھنے کے طریقوں کے لیے چند موافقت کی ضرورت تھی۔

محققین نے الگورتھم کو دوسرے ایجنٹ کے مقام کی پیشن گوئی کر کے ماہر پر فوکس کیا۔ انہوں نے اسے میموری ماڈیول بھی دیا۔ تربیت کے دوران، ماہر ماحول کے اندر اور باہر نکل جائے گا، جس سے ایجنٹ کو اس کے اعمال اس وقت یاد کرنے پر مجبور کر دیا جائے گا جب وہ موجود نہیں تھا۔ AI نے ماحول کے ایک وسیع سیٹ پر بھی تربیت حاصل کی، جس نے اس بات کو یقینی بنایا کہ اس نے ممکنہ کاموں کی ایک وسیع رینج دیکھی۔

اگرچہ زیادہ عملی ڈومینز میں نقطہ نظر کا ترجمہ کرنا مشکل ہوسکتا ہے۔ ایک اہم حد یہ ہے کہ جب محققین نے تجربہ کیا کہ آیا AI انسانی مظاہروں سے سیکھ سکتا ہے، تو ماہر ایجنٹ کو تمام تربیتی دوڑ کے دوران ایک شخص کے ذریعے کنٹرول کیا گیا۔ اس سے یہ جاننا مشکل ہو جاتا ہے کہ آیا ایجنٹ مختلف لوگوں سے سیکھ سکتے ہیں۔

زیادہ زور سے، تربیتی ماحول کو تصادفی طور پر تبدیل کرنے کی صلاحیت کو حقیقی دنیا میں دوبارہ بنانا مشکل ہوگا۔ اور بنیادی کام آسان تھا، جس میں موٹر کے ٹھیک کنٹرول کی ضرورت نہیں تھی اور یہ انتہائی کنٹرول شدہ ورچوئل ماحول میں ہوتا تھا۔

پھر بھی، AI میں سماجی سیکھنے کی پیش رفت خوش آئند ہے۔ اگر ہم ذہین مشینوں والی دنیا میں رہنا چاہتے ہیں تو ان کے ساتھ اپنے تجربے اور مہارت کو بانٹنے کے لیے موثر اور بدیہی طریقے تلاش کرنا بہت ضروری ہوگا۔

تصویری کریڈٹ: جولیانا اور ماریانا اموریم / Unsplash سے

ٹائم اسٹیمپ:

سے زیادہ یکسانیت مرکز