多指主动掌握学习

由柏拉图重新发布

关注： 0

这是对 2020 年一篇关于使用学习系统训练机器人手臂和手抓取物体的学术论文的评论。

基于学习的掌握规划的方法比分析方法更受青睐，因为它们能够更好地推广到新的、部分观察到的对象。然而，数据收集仍然是掌握学习方法的最大瓶颈之一，特别是对于多指手来说。手的相对高维配置空间加上日常生活中常见物体的多样性需要大量样本才能产生稳健且自信的抓取成功分类器。在本文中，研究人员提出了第一个用于抓取的主动深度学习方法，该方法以统一的方式搜索抓取配置空间和分类器置信度。研究人员的方法基于最近在规划多手指抓握方面取得的成功，作为利用学习的神经网络似然函数进行概率推理的方法。他们将其嵌入到样本选择的多臂老虎机公式中。他们表明，与使用分析规划器生成的抓取数据训练的被动监督学习方法相比，他们的主动抓取学习方法使用更少的训练样本来产生抓取成功率。 2020 年，研究人员还表明，主动学习者产生的掌握在形状上具有更大的定性和定量多样性。

Arxiv – 多指主动抓取学习

基于学习的抓取规划在过去十年中变得流行，因为它能够很好地泛化到仅具有部分视图对象信息的新对象。这些方法需要大量数据进行训练，特别是那些利用深度神经网络的方法。然而，大规模数据收集对于多指抓取仍然是一个挑战，因为（1）
日常生活中常见的物体在几何形状、纹理、惯性特性和外观方面表现出很大的变化；和
(2) 多指抓握配置的相对较高维度，（例如，22 维的配置
本文中的手和手腕姿势）。

较新的主动学习方法以交互方式学习抓取模型，与被动的监督抓取学习器相比，该模型使用更少的样本更好地覆盖不同对象的抓取配置空间。主动学习不是像标准监督学习那样被动地归纳假设来解释可用的训练数据，而是不断地、交互式地开发和测试新的假设。

当以下情况时，主动学习是最合适的：1）未标记的数据样本很多，2）需要大量的标记数据来训练准确的监督学习系统，3）数据样本可以很容易地收集或合成。抓取学习满足以下每个条件：1）有无限多种可能的抓取，2）需要大量标记的训练样本来覆盖空间，3）机器人是它自己的预言机 - 它可以尝试抓取并自动无需人工标记即可检测成功或失败。

特斯拉已经能够对物理世界中的物体进行自动标记。

Brian Wang 是一位未来主义思想领袖，也是一位每月拥有 1 万读者的热门科学博主。他的博客 Nextbigfuture.com 在科学新闻博客中排名第一。它涵盖了许多颠覆性技术和趋势，包括空间、机器人、人工智能、医学、抗衰老生物技术和纳米技术。

他以识别尖端技术而闻名，目前是一家初创公司的联合创始人，并为高潜力的早期公司筹集资金。他是深度技术投资的分配研究负责人，也是 Space Angels 的天使投资人。

他经常在公司发表演讲，曾是 TEDx 演讲者、奇点大学演讲者和众多广播和播客采访的嘉宾。他对公开演讲和咨询活动持开放态度。

时间戳记： 2022 年 9 月 6 日2022 年 9 月 7 日