Nvidia 声称，机器人手可以通过新的人工智能智能与人类的灵活性相媲美

关注： 0

英伟达研究人员在机器人灵活性方面实现了重大飞跃尤里卡，一种人工智能代理，据称可以像人类一样熟练地教机器人复杂的技能，例如转笔技巧。

周四发表的一篇论文概述了这项新技术，它建立在大型语言模型的最新进展的基础上，例如 OpenAI的GPT-4。 Eureka 利用生成式人工智能自主编写复杂的奖励算法，使机器人能够通过试错强化学习进行学习。该论文概述说，事实证明，这种方法比人类编写的程序有效 50% 以上。

Nvidia 的官方博客文章称，“Eureka 还教会了四足灵巧的手、协作机器人手臂和其他机器人打开抽屉、使用剪刀、接球和近 30 种不同的任务。”

Eureka 是 Nvidia 在使用语言模型引导人工智能方面的开创性工作的最新演示。近日，该公司开源转向LM——一种通过对人类反馈进行训练来使人工智能助手变得更有帮助的方法。

与 Eureka 类似，SteerLM 也利用了语言模型的进步，但将其重点放在不同的挑战上——改善 AI 助手的对齐。 SteerLM 通过让助理练习对话来训练他们，就像机器人通过实践来学习一样。该系统通过乐于助人、幽默和质量等属性对助理的反应提供反馈。

例如，它就像一个机器人从标记为好或坏的视频中学习跳舞，而不是让人类审查数千个随机舞蹈并选择哪些是好的或不好的（这是典型的方式）人工智能聊天机器人受过培训）。通过反复练习和获取反馈，助手学会根据用户的需求提供量身定制的响应。这有助于使人工智能更有利于现实世界的应用。

共同点是以创造性的新方式使用先进的神经网络，无论是教学机器人还是聊天机器人。 Nvidia 正在突破硬件和软件方面的界限。

对于尤里卡（Eureka）来说，关键是结合模拟技术，例如来自艾萨克健身房具有语言模型的模式识别能力。 Eureka 有效地“学会学习”，在多次训练运行中优化自己的奖励算法。它甚至接受人类输入来完善其奖励。

到目前为止，这种自我改进的方法已被证明具有高度的通用性，可以训练各种类型的机器人——有腿的、轮式的、飞行的和灵巧的手。

Nvidia 的 Eureka 和 SteerLM 不仅打破了障碍，还向机器人和人工智能传授技巧和富有洞察力的交互艺术。通过每一次挥笔和诙谐的交谈，他们正在勾勒出一个未来，人工智能不仅会模仿，而且会与我们一起创新。

时间戳记： 2023 年 2 月 3 日

Nvidia 声称，机器人手可以通过新的人工智能智能与人类相媲美 – Decrypt