Дослідники Nvidia досягли значного стрибка в спритності роботів завдяки Еврика, агент штучного інтелекту, який нібито може навчити ботів складним навичкам, як-от трюки з обертанням пера, так само вправно, як і люди.
Нова техніка, викладена в статті, опублікованій у четвер, базується на останніх досягненнях у великих мовних моделях, таких як OpenAI GPT-4. Eureka використовує генеративний штучний інтелект для автономного створення складних алгоритмів винагороди, які дозволяють роботам навчатися за допомогою навчання з підкріпленням методом проб і помилок. Цей підхід виявився більш ніж на 50% ефективнішим, ніж програми, створені людьми, йдеться в документі.
«Еврика також навчила чотирилапих спритних рук, рук коботів та інших роботів відкривати ящики, користуватися ножицями, ловити м’ячі та виконувати майже 30 різних завдань», — йдеться в офіційному блозі Nvidia.
Eureka — це остання демонстрація новаторської роботи Nvidia щодо керування ШІ за допомогою мовних моделей. Нещодавно компанія відкрила вихідний код SteerLM— метод, який налаштовує помічників зі штучним інтелектом, щоб вони були більш корисними, навчаючи їх відгукам людини.
Подібно до Eureka, SteerLM також використовує досягнення в мовних моделях, але зосереджує їх на іншому завданні — покращенні узгодження помічника ШІ. SteerLM навчає помічників, змушуючи їх практикувати розмови, як робот, який навчається на практиці. Система дає відгук про відповіді помічника через такі атрибути, як корисність, гумор і якість.
Наприклад, це схоже на те, що робот вчиться танцювати з відео, позначених як хороші чи погані, замість того, щоб людина переглядала тисячі випадкових танців і вибирала, які з них хороші чи ні (це типовий спосіб AI чат-боти навчаються). Постійно тренуючись і отримуючи відгуки, помічники вчаться надавати відповіді, адаптовані до потреб користувача. Це допомагає зробити ШІ більш корисним для реальних додатків.
Спільною ниткою є використання передових нейронних мереж у нові креативні способи, чи то навчання роботів, чи чат-ботів. Nvidia розсуває кордони як на апаратному, так і на програмному фронтах.
Для Eureka ключовим було поєднання технологій моделювання, подібних до тих, що були зроблені Тренажерний зал Ісака з досконалістю мовних моделей у розпізнаванні образів. Eureka ефективно «вчиться вчитися», оптимізуючи власні алгоритми винагороди під час кількох тренувань. Він навіть приймає людський внесок для вдосконалення своїх винагород.
Цей підхід до самовдосконалення наразі виявився досить узагальненим, навчаючи роботів усіх видів — з ногами, колесами, літаючими та спритними руками.
Eureka та SteerLM від Nvidia не просто долають бар’єри, вони навчають роботів та штучного інтелекту мистецтву витонченості та проникливої взаємодії. З кожним поворотом пера та дотепною розмовою вони малюють майбутнє, де штучний інтелект не просто імітує, а впроваджує інновації разом з нами.
Будьте в курсі криптовалютних новин, отримуйте щоденні оновлення на свою поштову скриньку.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://decrypt.co/202659/nvidia-eureka-ai-agent-allegedly-makes-robot-hands-dextrous-human-ones