谷歌教机器人为人类服务——大型语言模型是关键

由柏拉图重新发布

关注： 0

视频根据这家网络巨头的最新研究，谷歌最大的人工智能语言模型正在帮助机器人更灵活地理解和解释人类命令。

机器通常对非常具体的需求做出最好的反应——开放式的请求有时可能会让它们失望，并导致用户没有想到的结果。人们学会以一种僵硬的方式与机器人互动，比如以特定的方式提问以获得所需的回应。

然而，谷歌的最新系统，称为 PaLM-SayCan，有望变得更加智能。 Everyday Robots 的物理设备是从 Google X 衍生出来的一家初创公司，它的头部装有摄像头，长而直的身体后面有一个带有钳子的手臂，它位于一组轮子的顶部。

您可以在下面的视频中观看机器人的运行情况：

YouTube视频

问机器人，比如“我刚刚锻炼，你能给我买一份健康的零食吗？” 会推动它去取一个苹果。 “PaLM-SayCan [是一种可解释的通用方法，可以利用语言模型中的知识，使机器人能够遵循高级文本指令来执行基于物理的任务，”谷歌大脑团队的研究科学家解释.

谷歌推出了其最大的语言模型棕榈今年四月。 PaLM 接受了从互联网上抓取的数据的培训，但系统并没有发出开放式文本响应，而是适应了生成一个指令列表供机器人遵循。

说“我把可乐洒在桌子上了，你怎么把它扔掉，给我拿些东西来帮忙打扫？”提示 PaLM 理解这个问题并生成一个机器人可以遵循的步骤列表来完成任务，比如过去拿起罐子，把它扔进垃圾箱，然后得到一块海绵。

然而，像 PaLM 这样的大型语言模型 (LLM) 并不理解他们所说的任何内容的含义。出于这个原因，研究人员使用强化学习训练了一个单独的模型，将抽象语言融入视觉表示和动作。这样，机器人就学会了将“可乐”这个词与碳酸饮料罐的图像联系起来。

PaLM-SayCan 还学习了所谓的“可供性函数”——一种对在其环境中给定对象完成特定动作的可能性进行排序的方法。与真空吸尘器相比，机器人更有可能捡起海绵，例如，如果它检测到海绵但附近没有真空吸尘器。

“我们的方法 SayCan 在基于物理的任务中提取和利用 LLM 中的知识，”该团队在一篇文章中解释道。研究报告. “法学硕士 (Say) 提供了一个任务基础，以确定对高级目标有用的行动，而学习的可供性功能 (Can) 提供了一个世界基础，以确定可以根据计划执行什么。我们使用强化学习 (RL) 作为学习语言条件价值函数的一种方式，这些价值函数提供了世界上可能发生的事情的启示。”

为了防止机器人偏离任务，训练它只从 101 条不同的指令中选择动作。 Google 对其进行了训练以适应厨房——PaLM-SayCan 可以获取零食、饮料并执行简单的清洁任务。研究人员认为，LLM 是让机器人在给出抽象指令的情况下安全地执行更复杂任务的第一步。

“我们对许多现实世界机器人任务的实验证明了以高成功率计划和完成长视界、抽象、自然语言指令的能力。我们相信 PaLM-SayCan 的可解释性允许在现实世界中与机器人进行安全的用户交互，”他们总结道。 ®

时间戳记： 2022 年 8 月 18 日2022 年 8 月 18 日