گوگل روبوٹ کو انسانوں کی خدمت کرنا سکھاتا ہے – بڑے زبان کے ماڈلز کے ساتھ کلیدی PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

گوگل روبوٹس کو انسانوں کی خدمت کرنا سکھاتا ہے – بڑی زبان کے ماڈل کے ساتھ کلید

ویڈیو ویب دیو کی تازہ ترین تحقیق کے مطابق، گوگل کا سب سے بڑا اے آئی لینگویج ماڈل روبوٹس کو انسانی احکامات کو سمجھنے اور اس کی تشریح کرنے میں زیادہ لچکدار بننے میں مدد دے رہا ہے۔

مشینیں عام طور پر بہت ہی مخصوص مطالبات کا بہترین جواب دیتی ہیں - کھلی ہوئی درخواستیں بعض اوقات انہیں ختم کر سکتی ہیں اور ایسے نتائج کا باعث بن سکتی ہیں جو صارفین کے ذہن میں نہیں تھے۔ لوگ روبوٹس کے ساتھ سخت طریقے سے بات چیت کرنا سیکھتے ہیں، جیسے کہ مطلوبہ جواب حاصل کرنے کے لیے کسی خاص انداز میں سوالات پوچھنا۔

گوگل کا تازہ ترین نظام، جسے PaLM-SayCan کہا جاتا ہے، تاہم، زیادہ ہوشیار ہونے کا وعدہ کرتا ہے۔ ایوری ڈیے روبوٹس کا فزیکل ڈیوائس – گوگل ایکس سے نکلا ایک اسٹارٹ اپ – اس کے سر میں آنکھوں کے لیے کیمرے ہیں اور اس کے لمبے سیدھے جسم کے پیچھے پنسر کے ساتھ ایک بازو ہے، جو پہیوں کے ایک سیٹ کے اوپر بیٹھا ہے۔  

آپ نیچے دی گئی ویڈیو میں روبوٹ کو ایکشن میں دیکھ سکتے ہیں:

Youtube ویڈیوز

روبوٹ سے پوچھنا، کچھ ایسا ہی ہے کہ "میں نے ابھی کام کیا، کیا آپ مجھے صحت بخش ناشتہ دے سکتے ہیں؟" اسے ایک سیب لانے میں دھکیل دے گا۔ "PaLM-SayCan زبان کے ماڈلز سے علم کا فائدہ اٹھانے کے لیے ایک قابل تشریح اور عمومی نقطہ نظر ہے جو روبوٹ کو جسمانی طور پر بنیادی کاموں کو انجام دینے کے لیے اعلیٰ درجے کی متنی ہدایات پر عمل کرنے کے قابل بناتا ہے،" گوگل کی برین ٹیم کے تحقیقی سائنسدان وضاحت کی.

گوگل نے اپنی زبان کا سب سے بڑا ماڈل متعارف کرایا کھجور اس سال اپریل میں. PaLM کو انٹرنیٹ سے سکریپ کیے گئے ڈیٹا پر تربیت دی گئی تھی، لیکن اس کے بجائے کھلے الفاظ کے جوابات دینے کے بجائے روبوٹ کے لیے ہدایات کی فہرست تیار کرنے کے لیے نظام کو ڈھال لیا گیا۔

یہ کہتے ہوئے کہ "میں نے اپنا کوک میز پر پھینکا ہے، آپ اسے کیسے پھینکیں گے اور مجھے صاف کرنے میں مدد کے لیے کچھ لائیں گے؟"، PaLM کو سوال کو سمجھنے اور روبوٹ کے کام کو مکمل کرنے کے لیے ان اقدامات کی فہرست تیار کرنے کا اشارہ کرتا ہے، جیسے اوپر جانا ڈبے کو اٹھانا، ڈبے میں ڈالنا، اور سپنج لینا۔

بڑے لینگوئج ماڈل (LLMs) جیسے PaLM، تاہم، ان کی کہی ہوئی بات کا مطلب نہیں سمجھتے۔ اس وجہ سے، محققین نے تجریدی زبان کو بصری نمائندگی اور اعمال میں ڈھالنے کے لیے کمک سیکھنے کا استعمال کرتے ہوئے ایک علیحدہ ماڈل کو تربیت دی۔ اس طرح روبوٹ لفظ "کوک" کو فزی ڈرنک کین کی تصویر کے ساتھ جوڑنا سیکھتا ہے۔

PaLM-SayCan نام نہاد "افورڈنس فنکشنز" بھی سیکھتا ہے - ایک ایسا طریقہ جو اس کے ماحول میں دی گئی اشیاء کو ایک مخصوص کارروائی مکمل کرنے کے امکان کو درجہ دیتا ہے۔ روبوٹ کا ویکیوم کلینر کے مقابلے میں اسفنج لینے کا زیادہ امکان ہوتا ہے، مثال کے طور پر، اگر اسے اسفنج کا پتہ چلتا ہے لیکن اس کے قریب ویکیوم نہیں ہے۔ 

"ہمارا طریقہ، SayCan، جسمانی طور پر بنیادی کاموں میں LLMs کے اندر موجود علم کو نکالتا اور فائدہ اٹھاتا ہے،" ٹیم نے ایک بیان میں وضاحت کی۔ ریسرچ پیپر. "ایل ایل ایم (کہیں) ایک اعلیٰ سطحی مقصد کے لیے کارآمد کارروائیوں کا تعین کرنے کے لیے ایک ٹاسک گراؤنڈنگ فراہم کرتا ہے اور سیکھے ہوئے افورڈنس فنکشنز (کین) اس بات کا تعین کرنے کے لیے عالمی بنیاد فراہم کرتے ہیں کہ اس منصوبے پر کیا عمل کرنا ممکن ہے۔ ہم کمک سیکھنے (RL) کو زبان کے مشروط ویلیو فنکشنز کو سیکھنے کے طریقے کے طور پر استعمال کرتے ہیں جو دنیا میں جو کچھ ممکن ہے اس کی قیمت فراہم کرتے ہیں۔"

روبوٹ کو کام کو ختم کرنے سے روکنے کے لیے، اسے صرف 101 مختلف ہدایات سے کارروائیوں کو منتخب کرنے کی تربیت دی جاتی ہے۔ Google نے اسے باورچی خانے میں ڈھالنے کی تربیت دی – PaLM-SayCan اسنیکس، مشروبات حاصل کر سکتا ہے اور صفائی کے آسان کام انجام دے سکتا ہے۔ محققین کا خیال ہے کہ LLMs روبوٹ کو زیادہ پیچیدہ کاموں کو محفوظ طریقے سے انجام دینے کے لیے خلاصہ ہدایات دینے کا پہلا قدم ہے۔

"بہت سے حقیقی دنیا کے روبوٹک کاموں پر ہمارے تجربات اعلیٰ کامیابی کی شرح پر طویل افق، تجریدی، قدرتی زبان کی ہدایات کی منصوبہ بندی اور مکمل کرنے کی صلاحیت کو ظاہر کرتے ہیں۔ ہمیں یقین ہے کہ PaLM-SayCan کی تشریحی صلاحیت روبوٹس کے ساتھ حقیقی دنیا کے محفوظ صارف کے تعامل کی اجازت دیتی ہے،" انہوں نے نتیجہ اخذ کیا۔ ®

ٹائم اسٹیمپ:

سے زیادہ رجسٹر