マルチフィンガー アクティブ グラスプ ラーニング

画像

これは、学習システムを使用してロボット工学の腕と手を訓練して物体をつかむことに関する 2020 年の学術論文のレビューです。

計画を把握するための学習ベースのアプローチは、部分的に観察された新しいオブジェクトをより適切に一般化できるため、分析方法よりも優先されます。 ただし、データ収集は、特に多指の手の場合、把握学習方法の最大のボトルネックの 2020 つです。 日常生活で一般的なオブジェクトの多様性と相まって、手の比較的高次元の構成空間は、堅牢で自信を持って把握成功分類子を生成するためにかなりの数のサンプルを必要とします。 この論文では、研究者は、把握構成空間と分類器の信頼性を統一された方法で検索する、把握への最初のアクティブな深層学習アプローチを提示します。 研究者は、学習したニューラル ネットワークの尤度関数を使用した確率論的推論として、複数の指でつかむことを計画する最近の成功に基づいてアプローチしています。 彼らはこれをサンプル選択の多腕バンディット定式化に組み込んでいます。 彼らの能動的把握学習アプローチは、より少ないトレーニング サンプルを使用して、分析プランナーによって生成された把握データで訓練された受動的教師あり学習法と同等の把握成功率を生成することを示しています。 XNUMX 年には、研究者はさらに、アクティブ ラーナーによって生成された把握の形が質的および量的により多様であることを示しています。

Arxiv – マルチフィンガー アクティブ グラスプ ラーニング

学習ベースの把握計画は、部分ビューのオブジェクト情報のみを使用して新しいオブジェクトにうまく一般化できるため、過去 1 年間で一般的になってきました。 これらのアプローチ、特にディープ ニューラル ネットワークを利用するアプローチでは、トレーニングに大量のデータが必要です。 ただし、大規模なデータ収集は、(XNUMX)
日常生活で一般的なオブジェクトは、ジオメトリ、テクスチャ、慣性特性、および外観に関して大きな変化を示します。 と
(2) 多指把持構成の比較的高い次元 (例: 構成の場合は 22 次元)
手と手首のポーズ)。

新しい能動学習アプローチは、受動的な教師あり把握学習器と比較して、より少ないサンプルを使用して、さまざまなオブジェクトにわたる把握構成空間をより適切にカバーする把握モデルを対話的に学習します。 標準的な教師あり学習のように利用可能なトレーニング データを説明する仮説を受動的に誘導するのではなく、アクティブ ラーニングは新しい仮説を継続的かつインタラクティブに開発してテストします。

アクティブ ラーニングは、1) ラベル付けされていないデータ サンプルが多数ある場合、2) 正確な教師あり学習システムをトレーニングするために大量のラベル付けされたデータが必要な場合、および 3) データ サンプルを簡単に収集または合成できる場合に最適です。 把握学習は、次の各条件を満たします。1) 無限に多くの可能な把握が存在する、2) スペースをカバーするには多数のラベル付けされたトレーニング サンプルが必要である、3) ロボットはそれ自身のオラクルであり、把握を試みて自動的に人間のラベル付けなしで成功または失敗を検出します。

テスラはすでに、物理世界のオブジェクトの自動ラベル付けを行っています。

Brian Wangは未来派の思想的リーダーであり、月に1万人の読者を持つ人気の科学ブロガーです。 彼のブログNextbigfuture.comは、サイエンスニュースブログで第1位にランクされています。 宇宙、ロボット工学、人工知能、医学、アンチエイジングバイオテクノロジー、ナノテクノロジーなど、多くの破壊的技術とトレンドをカバーしています。

最先端のテクノロジーを特定することで知られる彼は、現在、潜在的な初期段階の企業のスタートアップおよび募金活動の共同創設者です。 彼は、ディープテクノロジー投資の割り当てに関する調査責任者であり、SpaceAngelsのエンジェル投資家です。

彼は企業で頻繁に講演を行っており、TEDxの講演者、シンガラリティ大学の講演者、ラジオやポッドキャストの多数のインタビューのゲストを務めています。 彼は人前で話すことと約束を助言することにオープンです。

タイムスタンプ:

より多くの 次の大きな未来