東京、26年2023月XNUMX日 – (JCN Newswire) – 富士通は本日、会話型AIモデルからの応答の信頼性を向上させるためのXNUMXつの新しいAIトラストテクノロジーの発売を発表しました。 新たに開発された技術には、会話型 AI モデルにおける幻覚(生成 AI が誤ったまたは無関係な出力を生成する現象)を検出する技術と、同社の小さな研究所で共同開発された技術が含まれます(1) ベングリオン大学では、偽の情報を注入するポイズニング攻撃を通じて AI の応答に埋め込まれたフィッシング サイトの URL を検出します。
富士通は、今回の新技術により、対話型AIの応答の信頼性を評価するツールを企業や個人のユーザーに提供し、最終的には導入を目指す企業など、さまざまなユースケースにおけるAIのより安全な活用に貢献していきたいと考えています。実際の操作。
ベングリオン大学のユヴァル・エロヴィシ教授は次のようにコメントしています。「生成AIは重要な領域であり、その中で富士通が開発した幻覚検出技術は、信頼できる対話型AIシステムを確立する上で極めて重要なものとして浮上しています。 ベングリオン大学 (BGU) と富士通の研究者は、敵対的な脅威に対する AI ベースの URL フィルタリングのセキュリティを強化する革新的な技術を開発しました。 私たちのブレークスルーは表形式のデータに焦点を当てており、その結果、AI 主導の URL フィルタリングの領域で敵対的な攻撃に対するより回復力の高い防御メカニズムが実現します。 今後、富士通とベングリオン大学は、生成 AI の領域内でセキュリティを中心とした新たな進歩を築くために協力する予定です。」
富士通は、「Fujitsu Kozuchi (コード名) – Fujitsu AI Platform」を通じて提供される会話型 AI コア エンジンにこれらの新技術を組み込み、ユーザーが幅広い強力な AI および ML テクノロジーにアクセスできるようにします。 会話型AIによる幻覚を検知する技術は28年2023月2023日から、会話型AIによるフィッシングサイトのURLを検知する技術はXNUMX年XNUMX月から国内ユーザー向けに提供開始されます。新技術はいずれも法人ユーザー向けに提供されます。 Kozuchi 経由でデモ環境を提供し、専用ポータル サイト経由で個人ユーザーに提供します (2)。 富士通は、将来的に両技術を世界市場に展開する予定です。
会話型AIを業務に活用する場合、企業は、あらかじめ登録した業務データから質問に関連する情報を抽出し、外部の会話型AIに質問する際の参考情報として追加する技術を活用することが多い。 この方法は正確な回答を提供し、幻覚を軽減しますが、場合によっては会話型 AI が質問に関連する情報を正しく抽出できず、無関係で不正確な回答を作成してしまうため、幻覚を完全に防止することは継続的な問題となっています。 AIの返答が幻覚である可能性の度合い(幻覚スコア)を推定する方法はありますが、会話型AIは同じ事実を表現するのにさまざまな異なるフレーズを使用するため、このスコアを正確に推定することは依然として困難です。
富士通は、会話型AIでは固有名詞や数字などの誤った情報が頻繁に生成され、質問を繰り返すと返答内容が異なる傾向にあるという知見をもとに、文章中の幻覚が起こりやすい箇所を特定して焦点を当てる技術を開発した。
高精度の幻覚スコアを計算するために、この新技術はまず AI の応答を 2 つの部分 (主語、述語、目的語など) に分解し、次に応答内の固有表現を自動的に識別します。 次のステップとして、このテクノロジーはこれらの名前付きエンティティを空白のままにして、外部 AI にこれらの特定の表現をより正確に定義するよう繰り返し要求します。 (図XNUMX)
富士通は、WikiBio GPT-3 幻覚データセット (3) 検出精度 (AUC-ROC) を向上できることがわかりました (4) SelfCheckGPT (5).
会話型 AI がトレーニング データに基づいて応答を作成すると、敵対的なエンティティが AI をだまして、AI トレーニング データに悪意のある情報を埋め込むことで、偽の Web サイトに誘導するフィッシング URL などの操作された情報を含む応答を作成させる可能性があります。
この課題に対処するために、富士通は対話型AIの応答から改ざんされたURLを検出する技術を開発しました。 このテクノロジーがフィッシング URL を特定すると、ユーザーに警告メッセージを発行します。
富士通の新技術は、フィッシングURLを検知するだけでなく、AIモデルを騙して故意の判断を誤らせる既存の攻撃に対するAIの耐性を高め、信頼性の高いAIの応答を実現します。 今回開発した技術は、富士通とネゲブのベングリオン大学がベングリオン大学に設立した富士通小規模研究所で共同開発した技術を活用したもの。 同技術は、敵対者が単一種類のAIモデルを攻撃することが多い傾向を利用し、さまざまな異なるAIモデルで情報を処理し、判定結果の根拠の違いを評価することで悪意のあるデータを検知する。
同技術は、フィッシングURLの検知だけでなく、表形式のデータを用いたAIモデルを欺く一般的な攻撃の防止や、他のサービスへの攻撃回避にも活用できる。
【1] 富士通小規模研究所:富士通の研究者が国内外の大学の技術インキュベーターに配属され、教授や次世代の研究者など各分野の第一人者と共同研究を行う取り組み。
【2] 個人ユーザーも、Fujitsu Research Portal でアカウントを作成することで、富士通の高度な API や Web アプリケーションを試すことができます。 (Fujitsu Research Portal:2023年XNUMX月より公開し、登録ユーザーに富士通の先進技術の体験版を提供するポータルサイト。富士通は「富士通 Kozuchi(開発コード名) – Fujitsu AI Platform」を通じて法人ユーザーに先進技術を提供しています)個人ユーザーへは本ポータルサイトを通じてご案内します。)
【3] WikiBio GPT-3 幻覚データセット :幻覚検出に関する Wikipedia に基づくベンチマーク データ
【4] AUC-ROC (受信機動作特性曲線の曲線下の面積):縦軸に真陽性率、横軸に偽陽性率をとり、異常スコアに対して判定の閾値を変化させたときの曲線の下の面積。 ランダムな異常スコアは 0.5、完全な答えは 1.0 です。 一般に0.7以上であれば一定の性能が得られると考えられます。
【5] SelfCheckGPT :英国ケンブリッジ大学で開発された幻覚検出技術
富士通の持続可能な開発目標(SDGs)への取り組み
2015年に国連で採択された持続可能な開発目標(SDGs)は、2030年までに世界で達成される一連の共通の目標を表しています。富士通の目的である「イノベーションを通じて社会への信頼を構築することで世界をより持続可能なものにする」は、 SDGsによって強化されたより良い未来のビジョンに貢献します。
富士通について
富士通の目的は、イノベーションを通じて社会への信頼を築き、世界をより持続可能なものにすることです。 100 か国以上のお客様に選ばれるデジタル トランスフォーメーション パートナーとして、124,000 人の従業員が、人類が直面している最大の課題のいくつかを解決するために働いています。 当社の幅広いサービスとソリューションは、コンピューティング、ネットワーク、AI、データとセキュリティ、コンバージング テクノロジーの 6702 つの主要なテクノロジーを利用しており、これらを組み合わせて持続可能性の変革を実現しています。 富士通株式会社 (TSE:3.7) は、28 年 31 月 2023 日に終了した会計年度に XNUMX 兆円 (XNUMX 億米ドル) の連結収益を報告し、市場シェアで日本のトップのデジタル サービス企業であり続けています。 詳細をご覧ください: www.fujitsu.com.
お問い合わせ先:
富士通株式会社
広報・投資家向け広報部
お問い合わせ(https://bit.ly/3rrQ4mB)
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://www.jcnnewswire.com/pressrelease/86719/3/
- :持っている
- :は
- :not
- :どこ
- 000
- 1
- 100
- 2015
- 2023
- 2030
- 視聴者の38%が
- 28
- 31
- 7
- a
- アクセス
- それに応じて
- 精度
- 正確な
- 正確にデジタル化
- 達成
- 越えて
- 実際の
- 加えます
- 住所
- 採択
- 高度な
- 進歩
- 敵対者
- に対して
- 先んじて
- AI
- AIモデル
- AIプラットフォーム
- AIシステム
- AIトレーニング
- 目指す
- 目指して
- また
- しかし
- an
- および
- 発表の
- 回答
- API
- 適用
- 約
- です
- AREA
- AS
- 質問
- At
- 攻撃
- 攻撃
- 自動的に
- 利用できます
- 避ける
- 軸
- ベース
- BE
- き
- よく
- ベン・グリオン
- ベングリオン大学
- ベンチマークされた
- より良いです
- 10億
- 両言語で
- 休憩
- 画期的な
- 持って来る
- 建物
- ビジネス
- ビジネス
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- 計算する
- ケンブリッジ
- 缶
- 例
- 一定
- 課題
- 変更
- 特性
- 選択
- コード
- 協力します
- 注釈
- コミットメント
- コマンドと
- 会社
- 比べ
- コンプリート
- コンピューティング
- プロフェッショナルな方法で
- 見なさ
- コンタクト
- 中身
- 貢献する
- 貢献
- 収束する
- 融合テクノロジー
- 会話
- 会話型AI
- 基本
- 企業
- 可能性
- 国
- 作成します。
- 作成
- 重大な
- 曲線
- Customers
- データ
- 専用の
- 防衛
- 定義します
- 度
- 配信する
- デモ
- 検出
- 検出
- 発展した
- 開発
- 異なる
- 違い
- 異なります
- 難しい
- デジタル
- デジタルサービス
- デジタルサービス会社
- ディビジョン
- ドメイン
- ダウン
- ドロー
- 埋め込まれた
- 出てくる
- 社員
- 権限を与え
- 終わった
- エンジン
- 高めます
- 確保
- エンティティ
- 環境
- 設立
- 確立
- 推定
- 等
- 評価する
- 評価します
- 既存の
- 表現します
- 表現
- 外部
- エキス
- 向い
- 実際
- 偽
- false
- フィールズ
- フィギュア
- フィルタリング
- もう完成させ、ワークスペースに掲示しましたか?
- 名
- 年度
- 五
- フォーカス
- 焦点を当てて
- 鍛造
- 発見
- 頻繁に
- から
- 富士通
- 未来
- 一般に
- 生成
- 世代
- 生々しい
- 生成AI
- グローバル
- 世界市場
- 目標
- 最大
- 持ってる
- より高い
- 非常に
- 水平な
- HTTPS
- 人類
- 識別する
- 識別する
- 画像
- 実装する
- 改善します
- in
- include
- 含めて
- 増加
- インキュベーター
- 個人
- 情報
- 注入します
- 革新的手法
- 革新的な
- 国際的に
- に
- 投資家
- IR部
- 問題
- 問題
- IT
- ITS
- 日本
- ジョイント
- JPG
- 六月
- キー
- ラボ
- 起動する
- 起動
- つながる
- 主要な
- レベル
- レバレッジ
- 可能性が高い
- 限定的
- make
- 作成
- 操作
- 3月
- 市場
- 市場占有率
- メカニズム
- メッセージ
- 方法
- メソッド
- かもしれない
- 心
- ML
- モデル
- 他には?
- 移動する
- 名
- 名前付き
- 国連
- ネットワーク
- 新作
- 新技術
- 新しく
- ニュースワイヤー
- 次の
- 名詞
- 小説
- 番号
- オブジェクト
- 得
- 10月
- of
- オファー
- 頻繁に
- on
- かつて
- 継続
- の
- 開いた
- 開いているデータ
- オペレーティング
- 業務執行統括
- or
- その他
- 私たちの
- でる
- 出力
- が
- 概要
- パートナー
- 部品
- 完璧
- パフォーマンス
- 現象
- フィッシング詐欺
- フレーズ
- 開拓者
- 極めて重要な
- プラン
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- ポータル
- 正の
- 強力な
- 防ぐ
- 防止
- 処理
- 約束
- 適切な
- 守る
- 提供します
- 提供
- は、大阪で
- 公共
- 目的
- 質問
- ランダム
- 範囲
- レート
- 根拠
- realm
- 軽減
- 登録された
- 関連する
- 関係
- 信頼性
- 信頼性のある
- 残っている
- 繰り返される
- 繰り返し
- 返信
- 報告
- 表す
- 表し
- 研究
- 研究者
- 弾力性のあります
- 尊重
- 回答
- 結果
- 結果として
- 収入
- 同じ
- スコア
- SDGs
- 安全に
- セキュリティ
- セブン
- 9月
- サービス
- サービス会社
- セッションに
- シェアする
- から
- ウェブサイト
- 小さい
- 社会
- ソリューション
- 一部
- 特定の
- スタンド
- 起動
- 最先端の
- 手順
- テーマ
- そのような
- 3つの柱
- 持続可能な
- 持続可能な発展
- システム
- 仕事
- テクノロジー
- テクノロジー
- より
- それ
- 未来
- 世界
- アプリ環境に合わせて
- その後
- ボーマン
- この
- 脅威
- 三
- しきい値
- 介して
- 従って
- 〜へ
- 今日
- 一緒に
- ツール
- top
- トレーニング
- 変換
- 変革パートナー
- トライアル
- 1兆
- true
- 信頼
- 信頼されている
- 信頼できる
- 試します
- 東証:6702
- 2
- type
- 最終的に
- できません
- 下
- ユナイテッド
- 国連
- 大学
- 大学
- ケンブリッジ大学
- URL
- つかいます
- 中古
- users
- 使用されます
- 値
- さまざまな
- バージョン
- 垂直
- 、
- ビジョン
- 警告
- we
- ウェブ
- Webアプリケーション
- ウェブサイト
- WELL
- いつ
- which
- while
- ワイド
- 広い範囲
- Wikipedia
- 意志
- 以内
- 仕事
- 世界
- 年
- 円
- ゼファーネット