富士通、会話型AIを幻覚や敵対的攻撃から守る新技術を発表

プラトン再発行

フォロワー： 0

東京、26年2023月XNUMX日 – (JCN Newswire) – 富士通は本日、会話型AIモデルからの応答の信頼性を向上させるためのXNUMXつの新しいAIトラストテクノロジーの発売を発表しました。新たに開発された技術には、会話型 AI モデルにおける幻覚（生成 AI が誤ったまたは無関係な出力を生成する現象）を検出する技術と、同社の小さな研究所で共同開発された技術が含まれます（1) ベングリオン大学では、偽の情報を注入するポイズニング攻撃を通じて AI の応答に埋め込まれたフィッシングサイトの URL を検出します。

富士通は、今回の新技術により、対話型AIの応答の信頼性を評価するツールを企業や個人のユーザーに提供し、最終的には導入を目指す企業など、さまざまなユースケースにおけるAIのより安全な活用に貢献していきたいと考えています。実際の操作。

ベングリオン大学のユヴァル・エロヴィシ教授は次のようにコメントしています。「生成AIは重要な領域であり、その中で富士通が開発した幻覚検出技術は、信頼できる対話型AIシステムを確立する上で極めて重要なものとして浮上しています。ベングリオン大学 (BGU) と富士通の研究者は、敵対的な脅威に対する AI ベースの URL フィルタリングのセキュリティを強化する革新的な技術を開発しました。私たちのブレークスルーは表形式のデータに焦点を当てており、その結果、AI 主導の URL フィルタリングの領域で敵対的な攻撃に対するより回復力の高い防御メカニズムが実現します。今後、富士通とベングリオン大学は、生成 AI の領域内でセキュリティを中心とした新たな進歩を築くために協力する予定です。」

富士通は、「Fujitsu Kozuchi (コード名) – Fujitsu AI Platform」を通じて提供される会話型 AI コアエンジンにこれらの新技術を組み込み、ユーザーが幅広い強力な AI および ML テクノロジーにアクセスできるようにします。会話型AIによる幻覚を検知する技術は28年2023月2023日から、会話型AIによるフィッシングサイトのURLを検知する技術はXNUMX年XNUMX月から国内ユーザー向けに提供開始されます。新技術はいずれも法人ユーザー向けに提供されます。 Kozuchi 経由でデモ環境を提供し、専用ポータルサイト経由で個人ユーザーに提供します (2）。富士通は、将来的に両技術を世界市場に展開する予定です。

富士通は、会話型 AI を幻覚や敵対的攻撃から保護する新技術 PlatoBlockchain Data Intelligence を発表します。垂直検索。あい。 — 図1. 信頼できる対話型AIの概要新開発技術1．会話型AIの応答から幻覚を高精度に検出する技術

会話型AIを業務に活用する場合、企業は、あらかじめ登録した業務データから質問に関連する情報を抽出し、外部の会話型AIに質問する際の参考情報として追加する技術を活用することが多い。この方法は正確な回答を提供し、幻覚を軽減しますが、場合によっては会話型 AI が質問に関連する情報を正しく抽出できず、無関係で不正確な回答を作成してしまうため、幻覚を完全に防止することは継続的な問題となっています。 AIの返答が幻覚である可能性の度合い（幻覚スコア）を推定する方法はありますが、会話型AIは同じ事実を表現するのにさまざまな異なるフレーズを使用するため、このスコアを正確に推定することは依然として困難です。

富士通は、会話型AIでは固有名詞や数字などの誤った情報が頻繁に生成され、質問を繰り返すと返答内容が異なる傾向にあるという知見をもとに、文章中の幻覚が起こりやすい箇所を特定して焦点を当てる技術を開発した。

高精度の幻覚スコアを計算するために、この新技術はまず AI の応答を 2 つの部分 (主語、述語、目的語など) に分解し、次に応答内の固有表現を自動的に識別します。次のステップとして、このテクノロジーはこれらの名前付きエンティティを空白のままにして、外部 AI にこれらの特定の表現をより正確に定義するよう繰り返し要求します。 (図XNUMX)

富士通は、WikiBio GPT-3 幻覚データセット (3) 検出精度 (AUC-ROC) を向上できることがわかりました (4) SelfCheckGPT (5).

会話型 AI がトレーニングデータに基づいて応答を作成すると、敵対的なエンティティが AI をだまして、AI トレーニングデータに悪意のある情報を埋め込むことで、偽の Web サイトに誘導するフィッシング URL などの操作された情報を含む応答を作成させる可能性があります。

この課題に対処するために、富士通は対話型AIの応答から改ざんされたURLを検出する技術を開発しました。このテクノロジーがフィッシング URL を特定すると、ユーザーに警告メッセージを発行します。

富士通の新技術は、フィッシングURLを検知するだけでなく、AIモデルを騙して故意の判断を誤らせる既存の攻撃に対するAIの耐性を高め、信頼性の高いAIの応答を実現します。今回開発した技術は、富士通とネゲブのベングリオン大学がベングリオン大学に設立した富士通小規模研究所で共同開発した技術を活用したもの。同技術は、敵対者が単一種類のAIモデルを攻撃することが多い傾向を利用し、さまざまな異なるAIモデルで情報を処理し、判定結果の根拠の違いを評価することで悪意のあるデータを検知する。

同技術は、フィッシングURLの検知だけでなく、表形式のデータを用いたAIモデルを欺く一般的な攻撃の防止や、他のサービスへの攻撃回避にも活用できる。

【1] 富士通小規模研究所：富士通の研究者が国内外の大学の技術インキュベーターに配属され、教授や次世代の研究者など各分野の第一人者と共同研究を行う取り組み。
【2] 個人ユーザーも、Fujitsu Research Portal でアカウントを作成することで、富士通の高度な API や Web アプリケーションを試すことができます。（Fujitsu Research Portal：2023年XNUMX月より公開し、登録ユーザーに富士通の先進技術の体験版を提供するポータルサイト。富士通は「富士通 Kozuchi（開発コード名） – Fujitsu AI Platform」を通じて法人ユーザーに先進技術を提供しています）個人ユーザーへは本ポータルサイトを通じてご案内します。）
【3] WikiBio GPT-3 幻覚データセット :幻覚検出に関する Wikipedia に基づくベンチマークデータ
【4] AUC-ROC (受信機動作特性曲線の曲線下の面積):縦軸に真陽性率、横軸に偽陽性率をとり、異常スコアに対して判定の閾値を変化させたときの曲線の下の面積。ランダムな異常スコアは 0.5、完全な答えは 1.0 です。一般に0.7以上であれば一定の性能が得られると考えられます。
【5] SelfCheckGPT :英国ケンブリッジ大学で開発された幻覚検出技術

富士通の持続可能な開発目標（SDGs）への取り組み

2015年に国連で採択された持続可能な開発目標（SDGs）は、2030年までに世界で達成される一連の共通の目標を表しています。富士通の目的である「イノベーションを通じて社会への信頼を構築することで世界をより持続可能なものにする」は、 SDGsによって強化されたより良い未来のビジョンに貢献します。

富士通について

富士通の目的は、イノベーションを通じて社会への信頼を築き、世界をより持続可能なものにすることです。 100 か国以上のお客様に選ばれるデジタルトランスフォーメーションパートナーとして、124,000 人の従業員が、人類が直面している最大の課題のいくつかを解決するために働いています。当社の幅広いサービスとソリューションは、コンピューティング、ネットワーク、AI、データとセキュリティ、コンバージングテクノロジーの 6702 つの主要なテクノロジーを利用しており、これらを組み合わせて持続可能性の変革を実現しています。富士通株式会社 (TSE:3.7) は、28 年 31 月 2023 日に終了した会計年度に XNUMX 兆円 (XNUMX 億米ドル) の連結収益を報告し、市場シェアで日本のトップのデジタルサービス企業であり続けています。詳細をご覧ください： www.fujitsu.com.

お問い合わせ先：
富士通株式会社
広報・投資家向け広報部
お問い合わせ（https://bit.ly/3rrQ4mB)

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
情報源： https://www.jcnnewswire.com/pressrelease/86719/3/

タイムスタンプ： 2023 年 9 月 25 日

タイムスタンプ： 2023 年 3 月 28 日

プラトン再発行

三菱電機ビルディングソリューションズ、インドネシアの新首都移転プロジェクトにエレベーター・エスカレーターを納入

いすゞエルフ、日立 Astemo センシングシステムを採用

新開発のラダーフレーム、シャシー、エンジンを採用した新型トライトン

トヨタ自動車、経営幹部の人事異動を発表

三菱パワーがエジプトの大手O＆G製油所ANRPCと水素燃料転換のための脱炭素協定を締結

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー