اس روبوٹ کتے کے پاس AI دماغ ہے اور اس نے خود کو صرف ایک گھنٹے میں چلنا سکھایا ہے PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

اس روبوٹ کتے کے پاس AI دماغ ہے اور اس نے خود کو صرف ایک گھنٹے میں چلنا سکھایا ہے۔

تصویر

کبھی غزال کے بچے کو چلنا سیکھتے دیکھا ہے؟ ایک شگفتہ، جو بنیادی طور پر ایک ممالیہ ڈیڈی لمبی ٹانگوں والا ہوتا ہے، اپنے پیروں سے کھسکتا ہے، گرتا ہے، کھڑا ہوتا ہے اور دوبارہ گر جاتا ہے۔ آخر کار، یہ اتنا لمبا کھڑا ہے کہ اس کی ٹوتھ پک جیسی ٹانگوں کو قریب سے گرنے کے سلسلے میں… حیرت انگیز طور پر، اس دلکش ڈسپلے کے چند منٹ بعد، ایک پرانے حامی کی طرح جھنڈا مار رہا ہے۔

ٹھیک ہے، اب ہمارے پاس اس کلاسک سیرینگیٹی منظر کا روبوٹ ورژن ہے۔

اس معاملے میں فاون یونیورسٹی آف کیلیفورنیا، برکلے کا روبوٹک کتا ہے۔ اور یہ اسی طرح ایک حیرت انگیز طور پر تیز سیکھنے والا ہے (باقی روبوٹ قسم کے نسبت)۔ روبوٹ اس لیے بھی خاص ہے کیونکہ، دوسرے چمکدار روبوٹس کے برعکس جو آپ نے آن لائن دیکھے ہوں گے، یہ مصنوعی ذہانت کا استعمال کرتے ہوئے خود کو چلنے کا طریقہ سکھاتا ہے۔

اپنی پیٹھ سے شروع کرتے ہوئے، ٹانگیں ہلاتے ہوئے، روبوٹ ایک گھنٹے میں خود کو پلٹنا، کھڑا ہونا اور چلنا سیکھتا ہے۔ گتے کے ایک رول کے ساتھ مزید دس منٹ ہراساں کرنا اسے یہ سکھانے کے لیے کافی ہے کہ اس کے ہینڈلرز کے ذریعے دھکیلنے سے کیسے برداشت کیا جائے اور اس سے چھٹکارا حاصل کیا جائے۔

یہ پہلی بار نہیں ہے ایک روبوٹ نے چلنا سیکھنے کے لیے مصنوعی ذہانت کا استعمال کیا ہے۔. لیکن جب کہ پہلے کے روبوٹس نے یہ ہنر آزمائشی اور غلطی کے ذریعے سیکھا اور نقل میں بے شمار تکرار پر برکلے بوٹ نے مکمل طور پر حقیقی دنیا میں سیکھا۔

[سرایت مواد]

ایک کاغذ شائع arXiv پری پرنٹ سرور پر، محققین — Danijar Hafner، Alejandro Escontrela، اور Philipp Wu — کا کہنا ہے کہ الگورتھم کو حقیقی دنیا میں نقل کرنے میں سیکھا ہوا منتقل کرنا سیدھا نہیں ہے۔ حقیقی دنیا اور نقلی کے درمیان چھوٹی تفصیلات اور فرق نئے روبوٹس کو ٹرپ کر سکتے ہیں۔ دوسری طرف، حقیقی دنیا میں الگورتھم کی تربیت ناقابل عمل ہے: اس میں بہت زیادہ وقت لگے گا اور ٹوٹنا پڑے گا۔

چار سال پہلے، مثال کے طور پر، OpenAI نے AI سے چلنے والا روبوٹک ہاتھ دکھایا جو مکعب میں ہیرا پھیری کر سکتا ہے۔ کنٹرول الگورتھم، Dactyl، کو اس نسبتاً آسان کام کو پورا کرنے کے لیے 100 CPUs اور 6,144 Nvidia V8 GPUs سے چلنے والے تخروپن میں تقریباً 100 سال کے تجربے کی ضرورت ہے۔ اس کے بعد سے چیزیں آگے بڑھی ہیں، لیکن مسئلہ بڑی حد تک باقی ہے۔ خالص کمک سیکھنے والے الگورتھم کو حقیقی دنیا میں تربیت حاصل کرنے کے لیے ہنر سیکھنے کے لیے بہت زیادہ آزمائش اور غلطی کی ضرورت ہوتی ہے۔ سیدھے الفاظ میں، سیکھنے کا عمل محققین کو توڑ دے گا۔ اور کسی بھی بامعنی پیش رفت سے پہلے روبوٹ۔

برکلے کی ٹیم ڈریمر نامی الگورتھم کے ساتھ اس مسئلے کو حل کرنے کے لیے نکلی۔ تعمیر کرنا جسے کہتے ہیں "عالمی ماڈلخواب دیکھنے والا اس امکان کو پیش کر سکتا ہے کہ مستقبل کی کارروائی اپنا مقصد حاصل کر لے گی۔ تجربے کے ساتھ، اس کے تخمینوں کی درستگی بہتر ہوتی ہے۔ پہلے سے کم کامیاب کارروائیوں کو فلٹر کرکے، عالمی ماڈل روبوٹ کو زیادہ مؤثر طریقے سے یہ جاننے کی اجازت دیتا ہے کہ کیا کام کرتا ہے۔

محققین لکھتے ہیں، "ماضی کے تجربے سے عالمی ماڈلز کو سیکھنا روبوٹ کو ممکنہ کارروائیوں کے مستقبل کے نتائج کا تصور کرنے کے قابل بناتا ہے، کامیاب طرز عمل کو سیکھنے کے لیے درکار حقیقی ماحول میں آزمائش اور غلطی کی مقدار کو کم کرتا ہے۔" "مستقبل کے نتائج کی پیشن گوئی کرتے ہوئے، عالمی ماڈلز منصوبہ بندی اور طرز عمل سیکھنے کی اجازت دیتے ہیں جس کی وجہ سے حقیقی دنیا کی بات چیت کی صرف تھوڑی مقدار ہوتی ہے۔"

دوسرے لفظوں میں، ایک عالمی ماڈل ایک نقلی تربیت کے سالوں کے مساوی وقت کو حقیقی دنیا میں ایک عجیب گھنٹہ سے زیادہ کم کر سکتا ہے۔

نقطہ نظر روبوٹ کتوں سے بھی زیادہ مطابقت رکھتا ہے۔ ٹیم نے ڈریمر کو پک اینڈ پلیس روبوٹک بازو اور پہیوں والے روبوٹ پر بھی لگایا۔ دونوں ہی صورتوں میں، انہوں نے پایا کہ ڈریمر نے اپنے روبوٹ کو مؤثر طریقے سے متعلقہ مہارتیں سیکھنے کی اجازت دی، کسی سم وقت کی ضرورت نہیں۔ مزید مہتواکانکشی مستقبل کی ایپلی کیشنز میں شامل ہوسکتا ہے۔ خود ڈرائیونگ کاروں.

بلاشبہ، ابھی بھی چیلنجز سے نمٹنے کے لیے موجود ہیں۔ اگرچہ کمک سیکھنا آج کے جدید ترین روبوٹس کے پیچھے کچھ پیچیدہ ہینڈ کوڈنگ کو خودکار بناتا ہے، لیکن اس کے لیے پھر بھی انجینئرز کو روبوٹ کے اہداف کی وضاحت کرنے کی ضرورت ہوتی ہے اور یہ کہ کامیابی کیا ہوتی ہے — ایک ایسی مشق جو وقت طلب اور حقیقی دنیا کے ماحول کے لیے کھلا ہے۔ اس کے علاوہ، اگرچہ روبوٹ یہاں ٹیم کے تجربات سے بچ گیا، لیکن زیادہ جدید مہارتوں پر طویل تربیت مستقبل کے بوٹس کے لیے بغیر کسی نقصان کے زندہ رہنے کے لیے بہت زیادہ ثابت ہو سکتی ہے۔ محققین کا کہنا ہے کہ تیز رفتار حقیقی دنیا کے سیکھنے کے ساتھ سمیلیٹر ٹریننگ کو جوڑنا مفید ثابت ہو سکتا ہے۔

پھر بھی، نتائج روبوٹکس میں AI کو ایک اور قدم آگے بڑھاتے ہیں۔ ڈریمر اس معاملے کو مضبوط کرتا ہے کہ "روبوٹ کنٹرول کے مستقبل میں کمک سیکھنے کا ایک بنیادی ذریعہ ہوگا،" جوناتھن ہرسٹ، اوریگون اسٹیٹ یونیورسٹی میں روبوٹکس کے پروفیسر بتایا ایم ائی ٹی ٹیکنالوجی کا جائزہ لیں. 

تصویری کریڈٹ: Danijar Hafner / YouTube

ٹائم اسٹیمپ:

سے زیادہ یکسانیت مرکز