گوگل به ربات‌ها می‌آموزد که به انسان‌ها خدمت کنند – با مدل‌های زبان بزرگ، هوش کلیدی PlatoBlockchain Data Intelligence. جستجوی عمودی Ai.

گوگل به روبات‌ها آموزش می‌دهد که به انسان‌ها خدمت کنند – با مدل‌های زبان بزرگ کلید

تصویری بر اساس آخرین تحقیقات این غول وب، بزرگترین مدل زبان هوش مصنوعی گوگل به ربات ها کمک می کند تا در درک و تفسیر دستورات انسانی انعطاف پذیرتر باشند.

ماشین‌ها معمولاً به خواسته‌های خیلی خاص بهترین پاسخ را می‌دهند – درخواست‌های باز گاهی اوقات می‌توانند آنها را از بین ببرند و به نتایجی منجر شوند که کاربران در ذهن نداشتند. افراد یاد می‌گیرند که با روبات‌ها به شیوه‌ای سفت و سخت تعامل کنند، مانند پرسیدن سؤالات به شیوه‌ای خاص برای دریافت پاسخ دلخواه.

با این حال، آخرین سیستم گوگل، با نام PaLM-SayCan، نوید هوشمندتر بودن را می دهد. دستگاه فیزیکی Everyday Robots - استارت آپی که از Google X ساخته شده است - دارای دوربین هایی برای چشم ها در سر و بازویی با انبر در پشت بدنه بلند و مستقیم خود است که در بالای مجموعه ای از چرخ ها قرار دارد.  

در ویدیوی زیر می‌توانید این ربات را در حال انجام تماشا کنید:

ویدئو یوتیوب

از ربات می پرسند، چیزی شبیه به "من تازه ورزش کردم، آیا می توانید یک میان وعده سالم برای من تهیه کنید؟" آن را وادار به آوردن یک سیب می کند. دانشمندان تیم مغز گوگل، "PaLM-SayCan [یک رویکرد قابل تفسیر و کلی برای استفاده از دانش از مدل‌های زبانی است که به یک ربات امکان می‌دهد دستورالعمل‌های متنی سطح بالا را برای انجام کارهای مبتنی بر فیزیکی دنبال کند." توضیح داده شده.

گوگل بزرگترین مدل زبان خود را معرفی کرد نخل در فروردین امسال PALM بر روی داده‌های خراشیده شده از اینترنت آموزش داده شد، اما به جای ارسال پاسخ‌های متنی باز، سیستم برای ایجاد فهرستی از دستورالعمل‌ها برای ربات سازگار شد.

با گفتن "من کوکاکولای خود را روی میز ریختم، چگونه آن را دور می اندازید و چیزی برای تمیز کردن برای من می آورید؟"، پالم را وادار می کند تا سوال را بفهمد و لیستی از مراحلی را که ربات می تواند برای تکمیل کار دنبال کند، مانند ادامه دادن، ایجاد کند. برای برداشتن قوطی، انداختن آن در سطل زباله و گرفتن یک اسفنج.

با این حال، مدل‌های زبان بزرگ (LLM) مانند PaLM، معنای هر چیزی را که می‌گویند نمی‌فهمند. به همین دلیل، محققان مدل جداگانه‌ای را با استفاده از یادگیری تقویتی آموزش دادند تا زبان انتزاعی را به بازنمایی‌ها و کنش‌های بصری تبدیل کنند. به این ترتیب ربات یاد می گیرد که کلمه "کک" را با تصویری از یک قوطی نوشابه گازدار مرتبط کند.

PaLM-SayCan همچنین به اصطلاح "عملکردهای affordance" را می آموزد - روشی که امکان تکمیل یک عمل خاص را در اشیاء موجود در محیط خود رتبه بندی می کند. به عنوان مثال، اگر ربات اسفنجی را تشخیص دهد اما در نزدیکی آن جاروبرقی نداشته باشد، احتمال بیشتری دارد که اسفنج را بگیرد تا جاروبرقی. 

این تیم توضیح داد: "روش ما، SayCan، دانش را در LLM ها در کارهای مبتنی بر فیزیکی استخراج و به کار می برد." مقاله تحقیقاتی. LLM (Say) زمینه ای برای تعیین اقدامات مفید برای یک هدف سطح بالا فراهم می کند و توابع استطاعت آموخته شده (Can) یک زمینه جهانی برای تعیین آنچه ممکن است بر اساس برنامه اجرا شود فراهم می کند. ما از یادگیری تقویتی (RL) به عنوان روشی برای یادگیری توابع ارزش شرطی زبان استفاده می کنیم که توانایی های ممکن را در جهان فراهم می کند.

برای جلوگیری از انحراف ربات از کار، آموزش داده شده است که اقدامات را فقط از 101 دستورالعمل مختلف انتخاب کند. Google آن را برای سازگاری با آشپزخانه آموزش داده است - PalM-SayCan می‌تواند تنقلات، نوشیدنی‌ها و کارهای تمیز کردن ساده را انجام دهد. محققان بر این باورند که LLM ها اولین گام برای واداشتن روبات ها به انجام وظایف پیچیده تر به صورت ایمن با دستورالعمل های انتزاعی هستند.

آزمایش‌های ما بر روی تعدادی از کارهای رباتیک در دنیای واقعی توانایی برنامه‌ریزی و تکمیل دستورالعمل‌های افق بلند، انتزاعی و زبان طبیعی را با نرخ موفقیت بالا نشان می‌دهد. ما معتقدیم که قابلیت تفسیر PalM-SayCan امکان تعامل امن کاربر در دنیای واقعی با روبات‌ها را فراهم می‌کند.» آنها نتیجه گرفتند. ®

تمبر زمان:

بیشتر از ثبت نام