ロボットハンドは新しい AI スマートで人間の器用さに匹敵すると Nvidia が主張 - Decrypt

ロボットハンドは新しい AI スマートで人間の器用さに匹敵すると Nvidia が主張 – Decrypt

ロボットハンドは新しい AI スマートで人間の器用さに匹敵すると Nvidia が主張 - PlatoBlockchain データ インテリジェンスの解読。垂直検索。あい。

Nvidia の研究者は、次のおかげでロボットの器用さにおいて大きな飛躍を達成しました。 Eureka、ペン回しのトリックなどの複雑なスキルを人間と同じように巧みにボットに教えることができると言われている AI エージェント。

木曜日に発表された論文で概要が説明されているこの新しい技術は、次のような大規模な言語モデルの最近の進歩に基づいています。 OpenAIのGPT-4。 Eureka は生成 AI を活用して、ロボットが試行錯誤の強化学習を通じて学習できるようにする高度な報酬アルゴリズムを自律的に作成します。 このアプローチは人間が作成したプログラムよりも 50% 以上効果的であることが証明されている、と論文の概要が述べられています。

Nvidia の公式ブログ投稿には、「エウレカはまた、四足歩行の器用な手、協働ロボットのアーム、その他のロボットに、引き出しを開けたり、ハサミを使ったり、ボールをキャッチしたり、約 30 種類の異なる作業を教えました」と述べています。 

Eureka は、言語モデルを使用して AI を操作するという Nvidia の先駆的な取り組みを示す最新のデモンストレーションです。 最近、同社はオープンソース化しました SteerLM—人間のフィードバックに基づいて AI アシスタントをトレーニングすることで、AI アシスタントをより役立つように調整する方法。

Eureka と同様に、SteerLM も言語モデルの進歩を利用していますが、AI アシスタントの調整の改善という別の課題に焦点を当てています。 SteerLM は、実践しながら学習するロボットのように、アシスタントに会話の練習をさせることでアシスタントをトレーニングします。 このシステムは、アシスタントの応答について、有用性、ユーモア、品質などの属性を通じてフィードバックを提供します。

たとえば、人間が何千ものランダムなダンスをレビューしてどれが良いか悪いかを選択するのではなく(これは一般的な方法です)、ロボットが良いか悪いかのラベルが付けられたビデオからダンスを学習するようなものです。 AIチャットボット 訓練を受けています)。 繰り返し練習してフィードバックを得ることで、アシスタントはユーザーのニーズに合わせた応答を提供できるようになります。 これにより、AI が現実世界のアプリケーションにとってさらに有益になります。

共通点は、ロボットを教えるかチャットボットを教えるかにかかわらず、創造的な新しい方法で高度なニューラル ネットワークを使用することです。 Nvidia は、ハードウェアとソフトウェアの両方の面で限界を押し広げています。

Eureka の場合、重要なのは、次のようなシミュレーション テクノロジーを組み合わせることでした。 アイザックジム 言語モデルのパターン認識能力を備えています。 Eureka は効果的に「学ぶことを学び」、複数回のトレーニング実行にわたって独自の報酬アルゴリズムを最適化します。 報酬を調整するために人間の入力も受け入れます。

この自己改善アプローチはこれまでのところ、脚付き、車輪付き、飛行、器用な手など、あらゆる種類のロボットを訓練する非常に一般化可能であることが証明されています。

Nvidia の Eureka と SteerLM は障壁を打ち破るだけでなく、ロボットや AI に巧みさと洞察力に富んだインタラクションの技術を教えています。 彼らは、ペンを回すたびに、機知に富んだおしゃべりをしながら、AI が単に模倣するだけでなく、私たちと一緒に革新する未来を描いています。

暗号ニュースを常に把握し、受信トレイで毎日更新を入手してください。

タイムスタンプ:

より多くの 解読する