Les mains des robots peuvent égaler la dextérité humaine avec les nouvelles intelligences artificielles, affirme Nvidia

Les mains des robots peuvent égaler la dextérité humaine avec les nouvelles intelligences artificielles, affirme Nvidia

Les mains des robots peuvent égaler la dextérité humaine avec les nouvelles intelligences de l'IA, affirme Nvidia - Decrypt PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Les chercheurs de Nvidia ont réalisé un bond majeur en matière de dextérité robotique grâce à Eureka, un agent d'IA qui serait capable d'enseigner aux robots des compétences complexes telles que des tours de stylo, aussi adroitement que les humains.

La nouvelle technique, décrite dans un article publié jeudi, s'appuie sur les progrès récents des grands modèles de langage tels que GPT-4 d'OpenAI. Eureka exploite l'IA générative pour écrire de manière autonome des algorithmes de récompense sophistiqués qui permettent aux robots d'apprendre via un apprentissage par renforcement par essais et erreurs. Cette approche s'est avérée plus de 50 % plus efficace que les programmes créés par des humains, souligne le document.

"Eureka a également appris à des mains quadrupèdes et adroites, à des bras de cobot et à d'autres robots à ouvrir des tiroirs, à utiliser des ciseaux, à attraper des balles et à près de 30 tâches différentes", indique un article de blog officiel de Nvidia. 

Eureka est la dernière démonstration du travail pionnier de Nvidia dans le pilotage de l'IA avec des modèles de langage. Récemment, la société open source PiloterLM– une méthode qui aligne les assistants IA pour qu’ils soient plus utiles en les formant aux commentaires humains.

Semblable à Eureka, SteerLM utilise également les avancées des modèles de langage, mais les concentre sur un défi différent : améliorer l'alignement de l'assistant IA. SteerLM forme les assistants en leur faisant pratiquer des conversations, comme un robot apprenant par la pratique. Le système donne des informations sur les réponses de l'assistant via des attributs tels que la serviabilité, l'humour et la qualité.

Par exemple, c'est comme si un robot apprenait à danser à partir de vidéos étiquetées comme bonnes ou mauvaises, au lieu de demander à un humain d'examiner des milliers de danses aléatoires et de sélectionner celles qui sont bonnes ou non (ce qui est la façon habituelle de procéder). Chatbots d'IA sont entraînés). En s'entraînant à plusieurs reprises et en obtenant des commentaires, les assistants apprennent à fournir des réponses adaptées aux besoins de l'utilisateur. Cela contribue à rendre l’IA plus bénéfique pour les applications du monde réel.

Le fil conducteur est l’utilisation de réseaux neuronaux avancés de manière créative et nouvelle, qu’il s’agisse de robots pédagogiques ou de chatbots. Nvidia repousse les limites tant sur le plan matériel que logiciel.

Pour Eureka, la clé était de combiner des technologies de simulation comme celles de Gymnase Isaac avec les prouesses de reconnaissance de formes des modèles de langage. Eureka « apprend à apprendre » efficacement, en optimisant ses propres algorithmes de récompense sur plusieurs cycles de formation. Il accepte même la contribution humaine pour affiner ses récompenses.

Cette approche d'auto-amélioration s'est révélée jusqu'à présent hautement généralisable, entraînant des robots de toutes sortes : jambes, roues, mains volantes et adroites.

Eureka et SteerLM de Nvidia ne se contentent pas de briser les barrières, ils enseignent aux robots et à l'IA l'art de la finesse et de l'interaction perspicace. À chaque tour de plume et à chaque conversation pleine d’esprit, ils dessinent un avenir où l’IA ne se contente pas d’imiter, mais innove à nos côtés.

Restez au courant des actualités cryptographiques, recevez des mises à jour quotidiennes dans votre boîte de réception.

Horodatage:

Plus de Décrypter