تصویری بر اساس آخرین تحقیقات این غول وب، بزرگترین مدل زبان هوش مصنوعی گوگل به ربات ها کمک می کند تا در درک و تفسیر دستورات انسانی انعطاف پذیرتر باشند.
ماشینها معمولاً به خواستههای خیلی خاص بهترین پاسخ را میدهند – درخواستهای باز گاهی اوقات میتوانند آنها را از بین ببرند و به نتایجی منجر شوند که کاربران در ذهن نداشتند. افراد یاد میگیرند که با روباتها به شیوهای سفت و سخت تعامل کنند، مانند پرسیدن سؤالات به شیوهای خاص برای دریافت پاسخ دلخواه.
با این حال، آخرین سیستم گوگل، با نام PaLM-SayCan، نوید هوشمندتر بودن را می دهد. دستگاه فیزیکی Everyday Robots - استارت آپی که از Google X ساخته شده است - دارای دوربین هایی برای چشم ها در سر و بازویی با انبر در پشت بدنه بلند و مستقیم خود است که در بالای مجموعه ای از چرخ ها قرار دارد.
در ویدیوی زیر میتوانید این ربات را در حال انجام تماشا کنید:
از ربات می پرسند، چیزی شبیه به "من تازه ورزش کردم، آیا می توانید یک میان وعده سالم برای من تهیه کنید؟" آن را وادار به آوردن یک سیب می کند. دانشمندان تیم مغز گوگل، "PaLM-SayCan [یک رویکرد قابل تفسیر و کلی برای استفاده از دانش از مدلهای زبانی است که به یک ربات امکان میدهد دستورالعملهای متنی سطح بالا را برای انجام کارهای مبتنی بر فیزیکی دنبال کند." توضیح داده شده.
گوگل بزرگترین مدل زبان خود را معرفی کرد نخل در فروردین امسال PALM بر روی دادههای خراشیده شده از اینترنت آموزش داده شد، اما به جای ارسال پاسخهای متنی باز، سیستم برای ایجاد فهرستی از دستورالعملها برای ربات سازگار شد.
با گفتن "من کوکاکولای خود را روی میز ریختم، چگونه آن را دور می اندازید و چیزی برای تمیز کردن برای من می آورید؟"، پالم را وادار می کند تا سوال را بفهمد و لیستی از مراحلی را که ربات می تواند برای تکمیل کار دنبال کند، مانند ادامه دادن، ایجاد کند. برای برداشتن قوطی، انداختن آن در سطل زباله و گرفتن یک اسفنج.
با این حال، مدلهای زبان بزرگ (LLM) مانند PaLM، معنای هر چیزی را که میگویند نمیفهمند. به همین دلیل، محققان مدل جداگانهای را با استفاده از یادگیری تقویتی آموزش دادند تا زبان انتزاعی را به بازنماییها و کنشهای بصری تبدیل کنند. به این ترتیب ربات یاد می گیرد که کلمه "کک" را با تصویری از یک قوطی نوشابه گازدار مرتبط کند.
PaLM-SayCan همچنین به اصطلاح "عملکردهای affordance" را می آموزد - روشی که امکان تکمیل یک عمل خاص را در اشیاء موجود در محیط خود رتبه بندی می کند. به عنوان مثال، اگر ربات اسفنجی را تشخیص دهد اما در نزدیکی آن جاروبرقی نداشته باشد، احتمال بیشتری دارد که اسفنج را بگیرد تا جاروبرقی.
این تیم توضیح داد: "روش ما، SayCan، دانش را در LLM ها در کارهای مبتنی بر فیزیکی استخراج و به کار می برد." مقاله تحقیقاتی. LLM (Say) زمینه ای برای تعیین اقدامات مفید برای یک هدف سطح بالا فراهم می کند و توابع استطاعت آموخته شده (Can) یک زمینه جهانی برای تعیین آنچه ممکن است بر اساس برنامه اجرا شود فراهم می کند. ما از یادگیری تقویتی (RL) به عنوان روشی برای یادگیری توابع ارزش شرطی زبان استفاده می کنیم که توانایی های ممکن را در جهان فراهم می کند.
برای جلوگیری از انحراف ربات از کار، آموزش داده شده است که اقدامات را فقط از 101 دستورالعمل مختلف انتخاب کند. Google آن را برای سازگاری با آشپزخانه آموزش داده است - PalM-SayCan میتواند تنقلات، نوشیدنیها و کارهای تمیز کردن ساده را انجام دهد. محققان بر این باورند که LLM ها اولین گام برای واداشتن روبات ها به انجام وظایف پیچیده تر به صورت ایمن با دستورالعمل های انتزاعی هستند.
آزمایشهای ما بر روی تعدادی از کارهای رباتیک در دنیای واقعی توانایی برنامهریزی و تکمیل دستورالعملهای افق بلند، انتزاعی و زبان طبیعی را با نرخ موفقیت بالا نشان میدهد. ما معتقدیم که قابلیت تفسیر PalM-SayCan امکان تعامل امن کاربر در دنیای واقعی با روباتها را فراهم میکند.» آنها نتیجه گرفتند. ®
- AI
- آی هنر
- مولد هنر ai
- ربات ai
- هوش مصنوعی
- گواهی هوش مصنوعی
- هوش مصنوعی در بانکداری
- ربات هوش مصنوعی
- ربات های هوش مصنوعی
- نرم افزار هوش مصنوعی
- بلاکچین
- کنفرانس بلاک چین ai
- coingenius
- هوش مصنوعی محاوره ای
- کنفرانس کریپتو ai
- دل-ه
- یادگیری عمیق
- گوگل ai
- فراگیری ماشین
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- بازی افلاطون
- PlatoData
- بازی پلاتو
- مقیاس Ai
- نحو
- ثبت نام
- زفیرنت