محققان انویدیا به لطف آن به جهشی بزرگ در مهارت روباتیک دست یافته اند ابراز پیروزی از اکتشاف، یک عامل هوش مصنوعی که ظاهراً می تواند مهارت های پیچیده ای مانند ترفندهای قلم زنی را به ربات ها به همان اندازه ماهرانه آموزش دهد.
تکنیک جدید، که در مقاله ای که پنجشنبه منتشر شد، بر اساس پیشرفت های اخیر در مدل های زبانی بزرگ مانند OpenAI GPT-4. Eureka از هوش مصنوعی مولد برای نوشتن خودکار الگوریتم های پاداش پیچیده استفاده می کند که ربات ها را قادر می سازد از طریق یادگیری تقویتی آزمون و خطا یاد بگیرند. این رویکرد بیش از 50 درصد مؤثرتر از برنامههای تألیف شده توسط انسان است.
یک پست وبلاگ رسمی توسط انویدیا میگوید: «اوریکا همچنین به دستهای چهارپا، زبردست، بازوهای کوبات و دیگر روباتها آموزش داده است که کشوها را باز کنند، از قیچی، توپها را بگیرند و نزدیک به 30 کار مختلف را بگیرند».
Eureka آخرین نمایش از کار پیشگامان Nvidia در هدایت هوش مصنوعی با مدلهای زبانی است. به تازگی، این شرکت منبع باز است SteerLM- روشی که دستیاران هوش مصنوعی را با آموزش بازخورد انسانی به آنها کمک می کند.
مشابه Eureka، SteerLM همچنین از پیشرفتها در مدلهای زبانی استفاده میکند، اما آنها را بر چالشی متفاوت متمرکز میکند – بهبود همترازی دستیار هوش مصنوعی. SteerLM دستیاران را با تمرین مکالمات، مانند رباتی که با انجام کار یاد می گیرد، آموزش می دهد. این سیستم از طریق ویژگی هایی مانند مفید بودن، شوخ طبعی و کیفیت، در مورد پاسخ های دستیار بازخورد می دهد.
به عنوان مثال، مانند یک روبات است که به جای اینکه هزاران رقص تصادفی را مرور کند و انتخاب کند که کدام یک خوب هستند یا نه، از ویدیوهایی که برچسب خوب یا بد دارند یاد می گیرد رقص کند. ربات های چت هوش مصنوعی آموزش دیده اند). با تمرین مکرر و دریافت بازخورد، دستیاران یاد میگیرند که پاسخهای متناسب با نیازهای کاربر ارائه دهند. این کمک می کند تا هوش مصنوعی برای برنامه های کاربردی دنیای واقعی مفیدتر باشد.
موضوع مشترک استفاده از شبکههای عصبی پیشرفته در روشهای خلاقانه جدید است، چه رباتهای آموزشی یا چتباتها. انویدیا در حال جابجایی مرزها در زمینه سخت افزار و نرم افزار است.
برای Eureka، کلید ترکیب فناوریهای شبیهسازی مانند آنهایی بود که از آن ساخته شد ورزشگاه اسحاق با قدرت تشخیص الگوی مدل های زبانی. Eureka به طور موثر "یاد می گیرد" و الگوریتم های پاداش خود را در چندین دوره آموزشی بهینه می کند. حتی برای اصلاح جوایزش، نظرات انسانی را می پذیرد.
این رویکرد خود-بهبودی تا کنون بسیار قابل تعمیم بوده است، آموزش انواع رباتها - دستهای پا، چرخدار، پرنده و ماهر.
Eureka و SteerLM انویدیا نه تنها موانع را میشکنند، بلکه به روباتها و هوش مصنوعی هنر ظرافت و تعامل هوشمندانه را آموزش میدهند. با هر چرخش قلم و چت شوخ، آنها آینده ای را ترسیم می کنند که در آن هوش مصنوعی نه تنها تقلید می کند، بلکه در کنار ما نوآوری می کند.
از اخبار ارزهای دیجیتال مطلع باشید، بهروزرسانیهای روزانه را در صندوق ورودی خود دریافت کنید.