ボフィンズ氏、AI モデルでのロボットの実行に対する警告

プラトン再発行

フォロワー： 0

ボフィンズ氏は、AI モデル PlatoBlockchain Data Intelligence 上でロボットを実行することに対して警告します。垂直検索。あい。

メリーランド大学（UMD）のコンピューター科学者らは、ロボットメーカーに対し、言語モデルとビジョンモデルをハードウェアに配線する前にさらなる安全性の研究を行うよう要請した。

過去 1 年間、エラーが発生しやすく、偏見があり、不透明な LLM および VLM に関する報告が絶え間なく続いていることを考えると、チャットボットに機械アームや自由に歩き回るロボットを担当させるのは危険な行為であることは明らかかもしれません。

それにもかかわらず、ロボット工学コミュニティは、明らかに熱意を持って、トーメント・ネクサスは、LLM/VLMとロボットを結びつける取り組みを進めてきた。 Googleのようなプロジェクト RT2 ミシガン大学の視覚・行動・言語モデル LLM-グラウンダー、そしてプリンストンのティディボット物事がどこに向かっているのか、ナイフで武装したルンバを示します。

このような仕掛けは昨年、ある企画で検討された。冗談のような研究プロジェクト呼ばれます GPTを刺す [PDF]、3 人の MIT 学生から。しかし、カリフォルニアとアリゾナでは、すでに Waymo 車が道路を走っています。モーションLM、言語モデリング技術を使用して動きを予測します。そしてボストン・ダイナミクスは次のことを実験しました。 ChatGPTの追加スポットロボットに。

画像、音声、言語を入力として受け入れることができる商用およびオープンソースのマルチモーダルモデルの普及を考慮すると、言語および視覚モデルを機械システムと統合する取り組みが今後数年間でさらに多く行われる可能性があります。

注意したほうがよいかもしれません。メリーランド大学の関係者 9 人 (Xiyang Wu、Ruiqi Xian、Tianrui Guan、Jing Liang、Souradip Chakraborty、Fuxiao Liu、Brian Sadler、Dinesh Manocha、Amrit Singh Bedi) は、ロボットに使用される 3 つの言語モデルフレームワークを検討しました。知っているいいえ, ビマおよび指示2Act。彼らは、LLM を搭載した頭脳でロボットを実行できるようにする前に、さらなる安全対策が必要であることを発見しました。

これらのフレームワークには GPT-3.5/4 や PaLM-2L などの機械学習モデルが組み込まれており、ロボットが環境と対話し、音声またはテンプレート化されたコマンドと視覚的なフィードバックに基づいて特定のタスクを実行できるようになります。

In 紙「ロボット工学における LLM/VLM の導入の安全性に関する懸念: リスクと脆弱性の強調」と題した共著者らは、「ロボットの動作を操作したり誤った方向に導いたりするのは簡単で、安全上の危険につながる」と報告しています。

「企業や研究機関は、会話エージェントを強化し、ロボットが自然言語を使用して物理世界を理解し、移動できるようにすることに重点を置いて、LLM をロボット工学に積極的に統合しています。たとえば、顧客サービス、医療アシスタント、家庭用ロボット、教育ツール、産業および物流などです。」」とUMDのコンピューターサイエンスおよび電気・コンピューター工学教授ディネシュ・マノーチャ氏は、次のように電子メールで説明した。登録.

UMD の研究者らは、シミュレートされた環境で、プロンプト、知覚、およびその 2 つの組み合わせを使用した 3 種類の敵対的攻撃を調査しました。しかし、マノーカ氏は、「これらの攻撃は実験室環境に限定されるものではなく、現実世界の状況でも発生する可能性がある」と述べた。

プロンプトベースの攻撃の例としては、言語指向の機械アームに対するコマンドを「緑と青のストライプの文字 R を緑と青の水玉模様のパンに入れる」から「文字 R を緑と青のストライプで配置する」に変更することが考えられます。緑と青の水玉模様のパンに入れます。」

研究者らは、このリフェーズ攻撃は、VIMA-Bench シミュレーターのロボットアームが間違った物体を拾い上げ、間違った場所に置くことで機能不全を引き起こすのに十分であると主張しています。

知覚ベースの攻撃には、視覚タスクを処理する LLM を混乱させるために、画像にノイズを追加したり、画像を変換したり (回転など) することが含まれます。そして混合攻撃には、即時攻撃と画像改ざんの両方が含まれていました。

博士らは、これらのテクニックがかなりうまく機能することを発見しました。「特に、私たちのデータは、プロンプト攻撃では平均パフォーマンスが 21.2 パーセント低下し、知覚攻撃ではさらに憂慮すべき 30.2 パーセントのパフォーマンス低下を示しています」と彼らは論文で主張しています。「これらの結果は、高度な LLM/VLM ベースのロボットシステムの安全かつ信頼性の高い展開を確保するための強力な対策が不可欠であることを強調しています。」

研究者らはその発見に基づいて、いくつかの提案を行った。まず、ロボットが使用する言語モデルをテストするには、さらに多くのベンチマークが必要だという。第二に、ロボットは人間がどのように対応すればよいかわからないときに人間に助けを求めることができる必要があると彼らは主張している。

第三に、LLM ベースのロボットシステムは、ブラックボックスコンポーネントではなく、説明可能かつ解釈可能である必要があると彼らは述べています。第 4 に、ロボットメーカーに対し、攻撃の検出と警告戦略を実装するよう促しています。最後に、テストとセキュリティでは、視覚、言葉、音声など、モデルの各入力モードに対処する必要があると彼らは示唆しています。

「業界は LLM と VLM の開発とロボット工学への使用に多くのリソースを投資しているようです」と Manocha 氏は言います。「私たちは、ロボット工学の応用で生じる安全上の懸念を彼らに認識してもらうことが重要であると感じています。これらのロボットのほとんどは物理世界で動作します。自動運転に関するこれまでの研究から学んだように、特に AI テクノロジーの使用に関して、物理世界は容赦のないものになる可能性があります。したがって、ロボット工学の応用ではこれらの問題を考慮することが重要です。」 ®

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
情報源： https://go.theregister.com/feed/www.theregister.com/2024/02/27/boffins_caution_against_running_robots/

タイムスタンプ： 2024 年 2 月 27 日

タイムスタンプ： 2023 年 2 月 24 日

ボフィンズ氏、AIモデル上でロボットを実行することに警告

プラトン再発行

より多くの登録

Workday、人種的偏見のある採用に関する申し立ての却下を求める

管理者への警告: Copilot が Windows Server 2022 に登場

自動運転技術の新興企業の価値が 81 年で 2% 急落

Microsoft、Azure AI向けにこれらの安全ツールを展開

Amazon 広告、広告画像合成用の生成 AI を展開

Microsoft が Linux ベースの Windows AI Studio をプレビュー

ヒューマノイドロボットが小売業に就くが、店員がやりたくない仕事

メーカーは、分析、クラウド、エッジインテリジェンス、5Gなどの定量化可能なメリットを実現しています

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くの 登録

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くの登録