ほぼ誰とでも、つまり人間であれば誰でもと話すと、会話で何が起こるかわかりません。 マリヘ・アリハニ これは、会話における自分の目標とパートナーの目標が衝突する瞬間、説明が必要な瞬間、混乱を引き起こしたり、意見の相違につながる瞬間を「健全な摩擦」と呼んでいます。
大規模な言語モデルではそうではありません。
ノースイースタン大学クーリー コンピューター サイエンス大学の助教授であるアリカニ氏は、ChatGPT のような大規模な言語モデルには確実性という点で深刻な問題があると述べています。
Alikhani 氏の新しいプロジェクトは、Friction for Accountability in Conversational Transactions (FACT) と呼ばれ、ノースイースタン大学、イリノイ大学アーバナ シャンペーン校、南カリフォルニア大学の共同研究によるものです。
FACT プロジェクトは、国防高等研究プロジェクト庁を通じた人工知能探査助成金を通じて資金提供されており、より透明性が高く公平な人工知能ツールを開発することを目的としています。
「人間のコミュニケーションを実りあるツールにしているものの 1 つは、私たちが自分の不確実性をスピーチや口調で表現しているという事実です」とアリハーニは言います。私たちはそれを表情に表しています。」
人間同士のコミュニケーションにおける不確実性から生じる健全な摩擦は、意見や視点の多様性を維持するのに役立つ、と彼女は続けます。
しかし、大規模な言語モデル (LLM) は不確実性を表現することに興味がなく、その結果、アリハーニ氏が「おべっかな行動」と呼ぶ結果が生じます。大規模な言語モデルは、ユーザーの「満足度を最大化したい」と考えており、そのステートメントに「[モデルが]自信を持っているかどうかにかかわらず、会話に摩擦を決して持ち込まない」と彼女は言います。
大規模な言語モデルでは、幻覚を起こす傾向があるため、さらなる問題が発生します。 LLM は「事実をでっち上げます。彼らはでっち上げられた事実について人々を説得するのがとても上手です。」
これらの問題にもかかわらず、人間はこれらの人工知能モデルによって生成された「事実」に過度に依存する傾向があり、それが「あなたを幸せにするために事実をでっち上げている可能性がある」ともアリハーニ氏は言う。
ユーザーが LLM に過度に依存する原因の 1 つは、LLM の「人間らしい動作」であると彼女は言います。 「それは私たちの認知を操作するでしょう。」
また、大規模な言語モデルは応答を瞬時に生成するようですが、これもユーザーが正しいと思い込むもう 1 つの要因です。 「私たちAI科学者にとって、人々に『はい、それは一貫しています』と言うのは難しいことです。はい、速いです。はい、あなたのスタイルに合わせています。しかし、それは幻覚です」とアリハーニは言います。
新しい助成金の下で、Alikhani 氏とそのチームは、LLM が発言について保持する確実性のレベルを実証し、人間と AI の会話に健全な摩擦を導入するツールを設計します。
「システムの信頼性をどのように予測して言語化できるでしょうか?」アリハーニは尋ねる。 AI モデルが「信頼度が 2% しかない場合、それを外部化する必要があります」。
「研究の主な目標の 1 つは、不確実性をモデル化し、不確実性を外部化すること」であり、人間と AI の会話の中でその不確実性を表現する方法を LLM に教えることです。これは、モデルの確実性のパーセンタイル スコアとしてユーザーのインターフェイスに表示される場合もあれば、モデルがより人間に近い方法で応答の不確実性を反映する場合もあります。
たとえば、Alikhani 氏は、患者が大規模な言語モデルに自分の健康について質問する状況を想像します。現世代の LLM は、たとえその答えが危険であることが判明したとしても、答えを提供しようとします。アリハーニ氏は、こう言えるモデルを構築したいと考えている。看護師に電話したほうがいいよ。』
「AI における説明責任の鍵となるのは堅牢性です」と Alikhani 氏は言います。現時点では、LLM がクエリに対して質問時に 1 つの回答を返し、数分後にはまったく異なる回答が返されるのが一般的です。
安全で説明責任のある AI の設計となると、単純なタスクを支援する可能性のある以前の AI システムは「他の多くのデータセットにアクセスできませんでした」とアリカニ氏は言います。なぜなら、それは彼らのデータになかったからです。」
これらのデータセットに何が含まれるか、または何が除外されるかが、LLM が「ジェンダー」に対して示すバイアスを克服する鍵となりますが、さらに、[大規模言語] モデルに反映される、逆グループとアウトグループやさまざまな認知バイアスなど、より微妙なバイアスも含まれます。
現在、アリハーニさんは「異なるアフォーダンスと好み」を持つ人々にサービスを提供するモデルを設計したいと考えていると彼女は言う。
「私たちは、データを持っている人口のためのシステムを構築し続けることだけを望んでいません。しかし、誰を置き去りにするのかを考え、この大きな不平等を悪化させるのではなく、どのようにして止めることができるでしょうか?」彼女は尋ねます。 「私の研究室の目標は、その方向に進むことです。」
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://www.mtlc.co/large-language-models-can-lie-to-you-this-professor-wants-you-to-know-when-they-do/
- :は
- :not
- :どこ
- $UP
- 2%
- a
- 私たちについて
- アクセス
- 説明責任
- 責任がある
- 高度な
- に対して
- 代理店
- AI
- AIシステム
- 目指して
- ほとんど
- また
- an
- および
- 別の
- 回答
- どれか
- 誰も
- 現れる
- です
- 発生します
- 人工の
- 人工知能
- AS
- 頼む
- 質問
- アシスタント
- 引き受けます
- At
- BE
- なぜなら
- 行動
- 背後に
- の間に
- バイアス
- 両言語で
- ビルド
- 建物
- 束
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- カリフォルニア州
- コール
- 呼ばれます
- コール
- 缶
- 確実性
- AI言語モデルを活用してコードのデバッグからデータの異常検出まで、
- 認知
- 認知
- コヒーレント
- 環境、テクノロジーを推奨
- カレッジ
- 来ます
- コマンドと
- コミュニケーション
- 完全に
- コンピュータ
- 信頼
- 確信して
- 混乱
- 続ける
- 貢献する
- 会話
- 会話
- 会話
- 協議会
- 電流プローブ
- 危険な
- データ
- データセット
- 防衛
- 実証します
- 設計
- 設計
- 開発する
- 異なります
- 方向
- ディスプレイ
- 多様性
- do
- ドント
- 出会い
- 公平な
- さらに
- 探査
- 表現する
- 表現
- フェイシャル
- 実際
- 要因
- 事実
- スピーディー
- 少数の
- 摩擦
- から
- 実りの多いです
- ギャップ
- 生成された
- 世代
- 目標
- 目標
- 良い
- 助成金
- ハッピー
- ハード
- 持ってる
- 健康
- 健康
- 助けます
- 彼女の
- 保持している
- 期待している
- 認定条件
- How To
- HTTPS
- 巨大な
- 人間
- 人間
- if
- イリノイ州
- 想像します
- in
- include
- 不平等
- 瞬時に
- を取得する必要がある者
- インテリジェンス
- 興味がある
- インタフェース
- に
- 紹介する
- 問題
- IT
- ITS
- ただ
- キープ
- キー
- 知っている
- ラボ
- 言語
- 大
- 後で
- つながる
- リーダーシップ
- 残す
- レベル
- リー
- ような
- LLM
- 製
- メイン
- 維持する
- make
- 作る
- 作成
- 質量
- 最大化します
- かもしれない
- 分
- モデル
- 瞬間
- モーメント
- 他には?
- my
- 新作
- 東北大学
- of
- on
- ONE
- 意見
- or
- その他
- 私たちの
- でる
- が
- 克服する
- 患者
- のワークプ
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 人口
- 予測する
- プ
- 前
- 問題
- 問題
- 作り出す
- 東京大学大学院海洋学研究室教授
- プロジェクト
- 提供します
- 置きます
- クエリー
- 質問
- 反映する
- 反映
- 信頼
- 表す
- 必要とする
- 研究
- 反応します
- 回答
- 結果として
- 安全な
- 言う
- 言う
- 科学
- 科学者たち
- スコア
- 思われる
- 深刻な
- サービス
- 彼女
- すべき
- 簡単な拡張で
- 状況
- So
- 南部の
- スピーチ
- ステートメント
- 文
- Force Stop
- そのような
- システム
- タスク
- チーム
- テク
- 言う
- 傾向
- それ
- アプリ環境に合わせて
- ボーマン
- 彼ら
- 物事
- 考える
- この
- それらの
- 介して
- 時間
- 〜へ
- TONE
- ツール
- 豊富なツール群
- に向かって
- に向かって
- 取引
- トランスペアレント
- 試します
- チューニング
- 順番
- 不確実性
- 大学
- us
- ユーザー
- users
- 対
- 非常に
- 視点
- 欲しいです
- 望んでいる
- ました
- 仕方..
- we
- この試験は
- いつ
- かどうか
- which
- 誰
- 意志
- 以内
- もっと悪い
- はい
- You
- あなたの
- ゼファーネット