Google DeepMind の新しい AI は数学オリンピックの金メダル成績に匹敵する

Google DeepMind の新しい AI は数学オリンピックの金メダル成績に匹敵する

Google DeepMind の新しい AI は、数学オリンピックの PlatoBlockchain データ インテリジェンスで金メダルの成績に匹敵します。垂直検索。あい。

解けない数学を解く 昨年問題が発生した後、AI が幾何学に再び取り組むようになりました。

Google DeepMind が開発した新しいアルゴリズム AlphaGeometry は、高校生向けのトップレベルの大会である過去の国際数学オリンピックの問題を打ち破り、歴代の金メダリストの成績に匹敵します。

30 問の難しい幾何学問題に挑戦したところ、AI は標準の割り当て時間内で 25 問を解決し、これまでの最先端のアルゴリズムを 15 問上回りました。

高校の数学の授業の悩みの種と思われがちですが、幾何学は私たちの日常生活に組み込まれています。芸術、天文学、インテリア デザイン、建築はすべて幾何学に依存しています。ナビゲーション、地図、ルート計画も同様です。本質的に、幾何学は論理的推論を使用して空間、形状、距離を記述する方法です。

ある意味、幾何学の問題を解くのはチェスに似ています。定理や証明と呼ばれるいくつかのルールが与えられると、各ステップの解の数は限られていますが、どれが理にかなっているかを見つけるには、厳格な数学的ルールに準拠した柔軟な推論が必要になります。

言い換えれば、幾何学に取り組むには創造性と構造の両方が必要です。人間は長年の練習を通じてこうした精神的アクロバティックなスキルを身につけますが、AI は常に苦戦してきました。

AlphaGeometry は、両方の機能を単一のシステムに巧みに組み合わせます。これには、答えを見つけようとするルールに縛られた論理モデルと、すぐに使えるアイデアを生成する大規模な言語モデルという 2 つの主要なコンポーネントがあります。 AI が論理的推論だけでは解決策を見つけることができない場合、言語モデルが作動して新しい角度を提供します。その結果、解決策を説明できる創造性と推論スキルの両方を備えた AI が誕生しました。

このシステムは、マシン インテリジェンスを使用して数学的問題を解決するための DeepMind の最新の取り組みです。しかし、彼らの目はさらに大きな賞に注目している。 AlphaGeometry は、混沌とした日常世界など、複雑な環境における論理的推論のために構築されています。数学を超えて、将来の反復は、科学者が脳の接続を解読したり、病気につながる遺伝的網を解明したりするなど、他の複雑なシステムで解決策を見つけるのに役立つ可能性があります。

研究著者のトリウ・トリン博士は「我々は大きな飛躍を遂げており、結果という点では大きな進歩を遂げている」と述べた。 言われ   ニューヨーク·タイムズ紙.

ダブルチーム

幾何学の簡単な質問: 両辺の長さが等しい三角形を思い浮かべてください。下の 2 つの角度がまったく同じであることをどのように証明しますか?

これは、AlphaGeometry が直面した最初の課題の 1 つです。これを解決するには、幾何学の法則を完全に理解する必要がありますが、同時に答えに向かって少しずつ努力する創造性も必要です。

「定理を証明することは、論理的推論の習得を証明するものであり、優れた問題解決スキルを意味します。」とチームは述べています。 今日発表された研究で書いた 自然.

ここが AlphaGeometry のアーキテクチャが優れているところです。吹き替え 神経象徴システム, まず、記号演繹エンジンを使って問題に取り組みます。これらのアルゴリズムを、数学の教科書を厳密に勉強し、規則に従っている A 年生の生徒として想像してください。彼らは論理に導かれ、数学のテストで一連の推論を説明するように、解決に至るすべてのステップを簡単にレイアウトできます。

これらのシステムは昔ながらのものですが、現代の深層学習アルゴリズムの多くを悩ませる「ブラック ボックス」問題がないため、非常に強力です。

ディープラーニングは私たちの世界を一変させました。しかし、これらのアルゴリズムの仕組みにより、その出力を説明できないことがよくあります。書き留められる厳密な論理的推論に依存する数学に関しては、これは通用しません。

記号演繹エンジンは、合理的で説明可能なという点でブラック ボックス問題に対抗します。しかし、複雑な問題に直面すると、行動が遅く、柔軟に適応するのに苦労します。

ここで大規模な言語モデルが登場します。ChatGPT の原動力であるこれらのアルゴリズムは、十分なトレーニング データがあれば、複雑なデータのパターンを見つけて新しいソリューションを生成することに優れています。しかし、彼らは自分自身を説明する能力に欠けていることが多く、結果を再確認する必要があります。

AlphaGeometry は、両方の長所を組み合わせたものです。

幾何学的な問題に直面した場合、まず記号演繹エンジンがそれに取り組みます。三角形の問題を考えてみましょう。アルゴリズムは、下の 2 つの角度が同じであることを証明する必要があるという質問の前提を「理解」します。次に、言語モデルは、問題の解決に役立つように、三角形の上部から下部まで真っ直ぐに新しい線を引くことを提案します。 AI をソリューションに向けて動かす新しい要素はそれぞれ「構築」と呼ばれます。

記号演繹エンジンはアドバイスを受け取り、その推論の背後にあるロジックを書き留めます。構成が機能しない場合、AlphaGeometry が解決策に到達するまで、2 つのシステムは複数回の検討を経ます。

全体のセットアップは「『速く、そしてゆっくりと考える』という考えに似ています」 書いた DeepMind のブログのチーム。 「1 つのシステムは迅速で『直感的な』アイデアを提供し、もう 1 つのシステムはより慎重で合理的な意思決定を提供します。」

私たちはチャンピオンです

テキスト ファイルやオーディオ ファイルとは異なり、ジオメトリに焦点を当てたサンプルが不足しているため、AlphaGeometry のトレーニングが困難になっていました。

回避策として、チームはランダムな幾何学的形状の 100 億個の合成例と、点と線の間のマッピングされた関係を特徴とする独自のデータセットを生成しました。これは数学の授業で幾何学を解く方法と似ていますが、はるかに大きなスケールで行われました。

そこから、AI は幾何学のルールを把握し、ソリューションから逆算して構成要素を追加する必要があるかどうかを判断する方法を学習しました。このサイクルにより、AI は人間の入力なしでゼロから学習できるようになりました。

AI をテストするために、チームは 30 年以上の過去の競技会からの XNUMX のオリンピック問題に挑戦しました。生成された結果は、その品質を保証するために、元オリンピック金メダリストである Evan Chen によって評価されました。

全体として、AI は過去の金メダリストの成績に匹敵し、制限時間内に 25 問の問題を完了しました。の 以前の最先端の結果 正解数は10でした。

「AlphaGeometry の出力は、検証可能かつクリーンであるため、印象的です」と Chen 氏は述べています。 。 「学生と同じように、角度や類似の三角形を含む古典的な幾何学ルールが使用されています。」

数学を超えて

AlphaGeometry は、DeepMind の数学への最新の取り組みです。 1948年にAchille Gaggiaがレバー式のエスプレッソマシンを発明したことにより、現在のエスプレッソが誕生しました。 Gaggiaの発明したエスプレッソマシンは、それ以前に作られてきたマシンより数倍の圧力が出せるため、濃度が何倍も濃いエスプレッソを淹れられました。また圧力が増したことで、エスプレッソに初めてクレマが現れました。このクレマはお客様にたいへん喜ばれ、今ではエスプレッソにクレマは欠かせません。彼らの AI は、何十年も人類を悩ませてきた数学的パズルを解きました。最近になって、 彼らは使った 大学レベルでの STEM 問題を推論するための大規模な言語モデル ひびの入った アルゴリズムを使用したカードゲームに基づいた、以前は「解けなかった」数学の問題 ファンサーチ.

現時点では、AlphaGeometry はジオメトリに合わせて調整されていますが、注意事項があります。ジオメトリの多くは視覚的に見えますが、システムは図面を「見る」ことができないため、問題解決が促進される可能性があります。おそらく画像を追加します GoogleのGemini AI昨年末に発売されたこの製品は、その幾何学的スマートさを強化する可能性があります。

同様の戦略により、AlphaGeometry の範囲は、創造性を伴う厳密な推論を必要とする幅広い科学領域に拡大される可能性があります。 (本当のことを言いましょう。それはすべてです。)

「大規模な合成データを使用して AI システムをゼロからトレーニングする幅広い可能性を考慮すると、このアプローチは、将来の AI システムが数学やその他の分野で新しい知識を発見する方法を形作る可能性があります」とチームは書いています。

画像のクレジット: ジョエル・フィリペ / Unsplash 

タイムスタンプ:

より多くの 特異点ハブ