Meta はウィキペディアの事実をチェックする AI を構築しています — 全 6.5 万の記事 PlatoBlockchain Data Intelligence。 垂直検索。 あい。

Meta はウィキペディアの事実をチェックする AI を構築している — 全 6.5 万の記事

画像

30 歳以上のほとんどの人は、古き良き百科事典で調べたことを覚えているでしょう。 本棚から分厚い本を取り出し、興味のあるトピックの索引を確認し、適切なページにめくって読み始めます。 Google の検索バーにいくつかの単語を入力するほど簡単ではありませんでしたが、良い面としては、 英国の または ワールドブック 正確で真実でした。

今日のインターネット調査ではそうではありません。 圧倒的多数の情報源は十分に混乱を招きましたが、誤情報の拡散を加えると、私たちがオンラインで読んだ言葉を信じるのは不思議です.

ウィキペディアがその好例です。 2020 年初頭の時点で、サイトの英語版の平均は約 1億1000万人 XNUMX 日あたりのページ ビュー数であり、インターネット上で XNUMX 番目にアクセス数の多い Web サイトとなっています。 先月の時点で、スポットに移動しました XNUMX番、および英語版は現在終了しています 1億1000万人 記事。

しかし、この頼りになる情報源はトラフィックが多いかもしれませんが、その正確さには何かが望まれています。 の ページ サイト自体の信頼性については、「このオンライン百科事典は、情報源として信頼できるとは考えておらず、読者が学術的または研究的な設定でそれを使用することを思いとどまらせています。」

以前の Facebook の Meta は、これを変えたいと考えています。 で ブログ投稿 先月公開された、同社の従業員は、AI がウィキペディアをより正確にするのにどのように役立つかを説明しています。

何万人もの人々がサイトの編集に参加していますが、彼らが追加する事実は必ずしも正しいとは限りません。 引用が存在する場合でも、それらが常に正確であるとは限りません。

メタは、これらの引用をスキャンし、それらのコンテンツをウィキペディアの記事と相互参照して、トピックが並んでいるだけでなく、引用されている特定の数値が正確であることを確認する機械学習モデルを開発しています。

これは、単に数字を選んで一致させるだけの問題ではありません。 メタの AI は、引用された情報源の内容を「理解する」必要があります (ただし、「理解する」というのは誤解です。複雑性理論の研究者である Melanie Mitchell は あなたに言うだろうなぜなら、AI はまだ「狭い」段階にあり、高度に洗練されたパターン認識のためのツールであることを意味しますが、「理解」は人間の認識に使用される言葉であり、それはまだ非常に異なるものだからです)。

Meta のモデルは、テキスト文字列を比較して同じ単語が含まれていることを確認するのではなく、自然言語理解 (NLU) 技術を使用して得られるテキスト ブロックの数学的表現を比較することによってコンテンツを「理解」します。

Meta の Fundamental AI Research テクニカル リード マネージャーである Fabio Petroni 氏は、次のように述べています。 言われ デジタルトレンド. 「それは一語一句を表しているのではなく、一節の意味を表しています。 これは、同様の意味を持つ XNUMX つのテキストのチャンクが、これらすべてのパッセージが格納される結果の n 次元空間の非常に近い位置に表示されることを意味します。」

AI は XNUMX 万件のウィキペディアの引用を基にトレーニングされており、サイト上の誤った引用を見つけるだけでなく、AI の作成者は最終的には正確な情報源を提案できるようになりたいと考えています。継続的に更新中。

解決しなければならない大きな問題の XNUMX つは、情報源の信頼性を評価するシステムで作業することです。 たとえば、科学雑誌の論文は、ブログ投稿よりも高い評価を得ます。 オンラインのコンテンツの量は非常に膨大で多様であるため、ほぼすべての主張を裏付ける「ソース」を見つけることができますが、偽情報から偽情報を解析すると (前者は間違っていることを意味し、後者は故意に欺くことを意味します)、査読済みのピアレビューされていないものから、急いで平手打ちされたものから事実を確認することは簡単な作業ではありませんが、信頼に関しては非常に重要な作業です。

メタはそのモデルをオープンソース化しており、興味のある人は デモ 検証ツールの。 Meta のブログ投稿によると、同社はこのプロジェクトで Wikimedia と提携しておらず、まだ研究段階にあり、現在 Wikipedia のコンテンツの更新には使用されていません。

ウィキペディアで読むすべての情報が正確で信頼できるものになる、それほど遠くない未来を想像すると、どんな種類の調査も少し簡単になりすぎませんか? いろいろな情報源を自分たちで調べて比較することには、何か価値があるのではないでしょうか? 重い本のページをめくることから、検索エンジンにいくつかの単語を入力して「Enter」を押すことまで、大きな飛躍がありました。 ウィキペディアが研究の出発点から最後の言葉の情報源に移行することを本当に望んでいるのでしょうか?

いずれにせよ、Meta の AI 研究チームは、オンライン百科事典を改善するためのツールに向けて作業を続けます。 「結局のところ、私たちは好奇心に突き動かされていたと思います」とペトローニ . 「私たちは、この技術の限界を知りたかったのです。 [この AI] がこのコンテキストで意味のあることをできるかどうかは、まったくわかりませんでした。 誰も似たようなことをしようとしたことはありませんでした。」

画像のクレジット: ゲルトアルトマン から Pixabay

タイムスタンプ:

より多くの 特異点ハブ