DeepMind AI は、PlatoBlockchain データ インテリジェンスのコンピューティングに不可欠な計算で数学者を圧倒します。 垂直検索。 あい。

DeepMind AI は、コンピューティングにとって重要な計算で数学者を圧倒します

DeepMind は再びそれを行いました。

生物学の根本的な課題を解決した後、タンパク質構造の予測-そして 結び目理論の数学のもつれを解く、何千もの日常的なアプリケーションに組み込まれている基本的なコンピューティング プロセスに狙いを定めています。 画像の解析から モデリング天気 あるいは、人工ニューラル ネットワークの内部動作を調査することさえできれば、AI は理論的にはさまざまな分野で計算を高速化し、エネルギー使用とコストを削減しながら効率を高めることができます。

でももっと印象的なのは 彼らがした。 AlphaTensor と呼ばれる記録破りのアルゴリズムは、 アルファゼロ、チェスと囲碁で人間のプレーヤーを打ち負かしたことで有名です。

「アルゴリズムは、何千年もの間、基本的な操作を実行するために世界中の文明で使用されてきました。」 書いた 共著者 Drs. DeepMind の Matej Balog と Alhussein Fawzi。 「しかし、アルゴリズムを発見することは非常に困難です。」

AlphaTensor は、AI が人間のエンジニアを凌駕するプログラムを設計すると同時に、自身のマシンの「頭脳」を改善する新しい世界への道を切り開きます。

「この研究は、人々が何十年にもわたって取り組んできた最適化問題に AI を使用することで、未知の領域に踏み込みます…AI が見つけた解決策は、計算実行時間を改善するためにすぐに開発できます」と、 自然、その 公表 研究。

行列乗算に入る

AlphaTensor が直面する問題は、行列の乗算です。 緑の数字の行と列が画面を下にスクロールしているのを突然想像した場合、それはあなただけではありません。 大まかに言えば、マトリックスはそのようなものです。つまり、選択したデータをデジタルで表す数値のグリッドです。 画像のピクセル、サウンド クリップの周波数、ビデオ ゲームのキャラクターの外見や動作などです。

行列の乗算は、数値の XNUMX つのグリッドを取り、XNUMX つをもう XNUMX つ乗算します。 これは高校でよく教えられる計算ですが、コンピューティング システムにとっても重要です。 ここでは、ある行列の数値の行が別の行列の列と乗算されます。 結果は結果を生成します。たとえば、ビデオ ゲーム シーンのビューをズームインしたり傾けたりするコマンドです。 これらの計算は内部で行われますが、電話やコンピューターを使用している人は、毎日その結果に依存しています。

問題が非常に難しく、非常に速くなることがわかります。 大きな行列の乗算は、非常にエネルギーと時間がかかります。 新しい行列を構築するには、各数値ペアを個別に乗算する必要があります。 行列が大きくなるにつれて、問題は急速に支持できなくなります。チェスや囲碁の最高の動きを予測するよりもなおさらです。 一部の専門家は、 より多くの方法 宇宙の原子の数より行列の掛け算を解きます。

1969 年にさかのぼると、ドイツの数学者であるフォルカー シュトラッセンは、手抜きをする方法があることを示し、XNUMX 行 XNUMX 列の行列の乗算を XNUMX ラウンド削減しました。 全部でXNUMXからXNUMX. 印象的ではないかもしれませんが、Strassen の方法は、行列乗算の演算 (つまりアルゴリズム) の長年の標準を打ち破ることができることを示しました。 彼のアプローチである Strassen アルゴリズムは、50 年以上にわたって最も効率的なアプローチとして君臨してきました。

しかし、もっと効率的な方法があるとしたらどうでしょうか? 「それを解くための最良のアルゴリズムは誰も知りません」と、この研究には関与していない日本の名古屋大学のフランソワ・ル・ガル博士は、 言われ MITテクノロジーレビュー. 「これは、コンピューター サイエンスにおける最大の未解決問題の XNUMX つです。」

AI追跡アルゴリズム

人間の直感が衰えているのなら、機械的な心を利用してみませんか?

新しい研究では、DeepMind チームは行列の乗算をゲームに変えました。 前身の AlphaZero と同様に、AlphaTensor は、生物の脳の学習方法に着想を得た機械学習手法である深層強化学習を使用します。 ここでは、AI エージェント (多くの場合、人工ニューラル ネットワーク) が環境と対話して、多段階の問題を解決します。 成功すると、「報酬」が得られます。つまり、AI のネットワーク パラメータが更新されるため、将来再び成功する可能性が高くなります。

パンケーキをひっくり返すことを学ぶようなものです。 くじは最初は床に落ちますが、最終的にはニューラル ネットワークが腕と手の動きを学習して完璧なひっくり返しを行います。

AlphaTensor のトレーニング グラウンドは、一種の 3D ボード ゲームです。 これは基本的に、数独にほぼ似た XNUMX 人用のパズルです。 AI は、XNUMX 兆を超える無数の許容される動きから選択しながら、可能な限り少ないステップで数字のグリッドを乗算する必要があります。

これらの許容される移動は、AlphaTensor に細心の注意を払って設計されています。 記者会見で、共著者の Hussain Fawzi 博士は次のように説明しました。

言い換えれば、気が遠くなるような選択肢の配列に直面したとき、干し草の山から針を見つける可能性を高めるためにそれらを絞り込むにはどうすればよいでしょうか? そして、干し草の山全体を掘り下げることなく、針にたどり着くための最善の戦略を立てるにはどうすればよいでしょうか?

チームが AlphaTensor に組み込んだ XNUMX つのトリックは、ツリー検索と呼ばれる方法です。 比喩的に言えば、干し草の山を無作為に掘り下げるのではなく、AI はより良い結果につながる可能性のある「道」を探ります。 中間の学習は、AI が次の動きを計画して成功の可能性を高めるのに役立ちます。 チームはまた、子供にチェスの最初の動きを教えるなど、成功したゲームのアルゴリズム サンプルも示しました。 最後に、AI が価値のある動きを発見すると、チームはより良い結果を求めて、よりカスタマイズされた学習のためにそれらの操作を並べ替えることを許可しました。

新しい地面を破る

AlphaTensor はうまく機能しました。 一連のテストで、チームは AI に最大 XNUMX 行 XNUMX 列の行列 (つまり、行または列にそれぞれ XNUMX つの数値がある) の最も効果的な解を見つけるように要求しました。

このアルゴリズムは、シュトラッセンの元のハックを急速に再発見しましたが、その後、人間の頭脳によって以前に考案されたすべてのソリューションを上回りました。 さまざまなサイズのマトリックスで AI をテストしたところ、AlphaTensor は 70 以上のより効率的なソリューションを見つけました。 「気が遠くなるようなものです。」

あるケースでは、80 行 76 列の行列と 919 行 896 列の行列を乗算することで、AI は以前の記録である XNUMX 回の個々の乗算を XNUMX 回にまで削減しました。また、AI はより大きな行列にも効果を発揮し、XNUMX 回に必要な計算数を削減しました。 XNUMX から XNUMX までの XNUMX 行 XNUMX 列の行列。

概念実証を手にしたチームは、実際の使用に目を向けました。 多くの場合、コンピュータ チップはさまざまな計算を最適化するように設計されています。 機械学習用 AI チップ—そして、アルゴリズムを最適なハードウェアと一致させることで、効率が向上します。

ここで、チームは AlphaTensor を使用して、機械学習で人気のある 100 つのチップ (NVIDIA V20 GPU と Google TPU) のアルゴリズムを見つけました。 全体として、AI が開発したアルゴリズムにより、計算速度が最大 XNUMX% 向上しました。

AIがスマートフォン、ラップトップ、またはその他の日常的なデバイスを高速化できるかどうかを言うのは難しいです. しかし、MIT のバージニア ウィリアムズ博士は次のように述べています。 「パフォーマンスが向上すると、多くのアプリケーションが改善されます。」

AIの心

AlphaTensor が行列乗算の最新の人間の記録を破ったにもかかわらず、DeepMind チームはその理由をまだ説明できません。

DeepMind の科学者で共著者の Pushmeet Kohli 博士は、記者会見で次のように述べています。

進化するアルゴリズムも人間対機械である必要はありません。

AlphaTensor はより高速なアルゴリズムへの足がかりですが、さらに高速なアルゴリズムが存在する可能性があります。 「検索を特定の形式のアルゴリズムに制限する必要があるため、より効率的な他のタイプのアルゴリズムを見逃す可能性があります」とバログとフォージは書いています。

おそらく、さらに興味をそそる道は、人間と機械の直感を組み合わせることでしょう。 「この新しい方法が実際に以前の方法をすべて包含するかどうか、またはそれらを組み合わせてさらに優れたものを得ることができるかどうかを判断するのは良いことです.」 ウィリアムズ。 他の専門家も同意見です。 豊富なアルゴリズムを自由に使用できるため、科学者は AlphaTensor のソリューションを動かした原因の手がかりを求めてそれらを分析し始め、次のブレークスルーへの道を開くことができます。

画像クレジット:DeepMind

タイムスタンプ:

より多くの 特異点ハブ