DeepMind AI One-Ups 数学家在计算 PlatoBlockchain 数据智能的关键计算中。 垂直搜索。 哎。

DeepMind AI One-Ups 让数学家在对计算至关重要的计算中脱颖而出

DeepMind 又做到了。

在解决了生物学的一个基本挑战之后——预测蛋白质结构-和 解开结理论的数学,它的目标是嵌入在数千个日常应用程序中的基本计算过程。 从解析图像到 模拟天气 甚至探索人工神经网络的内部工作原理,从理论上讲,人工智能可以加速一系列领域的计算,提高效率,同时降低能源使用和成本。

但更令人印象深刻的是 形成一种 他们做到了。 被称为 AlphaTensor 的破纪录算法是 零度,它以在国际象棋和围棋中击败人类玩家而闻名。

“数千年来,算法已在世界文明中用于执行基本操作,” 合著者 Drs。 DeepMind 的 Matej Balog 和 Alhussein Fawzi。 “然而,发现算法极具挑战性。”

AlphaTensor 开辟了一条通往新世界的道路,在这个新世界中,人工智能设计的程序性能优于任何人类工程师,同时改进了自己的机器“大脑”。

“这项工作通过使用人工智能解决人们已经研究了数十年的优化问题,进入了未知领域……它发现的解决方案可以立即开发以改善计算运行时间,”高级编辑 Federico Levi 博士说 自然,这 出版 研究。

输入矩阵乘法

AlphaTensor 面临的问题是矩阵乘法。 如果您突然想到向下滚动屏幕的绿色数字行和列,那么您并不孤单。 粗略地说,矩阵有点像 - 一个数字网格,以数字方式表示您选择的数据。 它可以是图像中的像素、声音片段的频率,或者视频游戏中角色的外观和动作。

矩阵乘法需要两个数字网格,然后一个一个相乘。 这是一种经常在高中教授的计算,但对计算系统也很重要。 在这里,一个矩阵中的数字行与另一个矩阵中的列相乘。 结果会产生结果——例如,放大或倾斜视频游戏场景视图的命令。 尽管这些计算在后台运行,但任何使用手机或计算机的人每天都依赖于他们的结果。

你可以看到这个问题是如何变得非常困难、非常快的。 乘以大型矩阵非常耗费精力和时间。 每个数字对都必须单独相乘以构造一个新矩阵。 随着矩阵的增长,这个问题很快变得站不住脚——甚至比预测最好的国际象棋或围棋走法更是如此。 有专家估计有 更多方式 解决矩阵乘法比宇宙中的原子数。

早在 1969 年,德国数学家 Volker Strassen 就展示了一些偷工减料的方法,将一轮 XNUMX×XNUMX 矩阵乘法从 一共八到七个. 这听起来可能并不令人印象深刻,但 Strassen 的方法表明,矩阵乘法有可能超越长期以来的操作标准(即算法)。 他的方法,即施特拉森算法,50 多年来一直是最有效的方法。

但是如果有更有效的方法呢? “没有人知道解决它的最佳算法,”日本名古屋大学的 François Le Gall 博士,他没有参与这项工作, 告诉 科技创业. “这是计算机科学中最大的开放性问题之一。”

人工智能追逐算法

如果人类的直觉步履蹒跚,为什么不利用机械思维呢?

在这项新研究中,DeepMind 团队将矩阵乘法变成了一种游戏。 与其前身 AlphaZero 类似,AlphaTensor 使用深度强化学习,这是一种受生物大脑学习方式启发的机器学习方法。 在这里,人工智能代理(通常是人工神经网络)与其环境交互以解决多步骤问题。 如果它成功了,它就会获得“奖励”——也就是说,人工智能的网络参数会被更新,因此它未来更有可能再次成功。

这就像学习翻转煎饼。 很多东西最初会掉在地板上,但最终你的神经网络会学习手臂和手部的动作以实现完美的翻转。

AlphaTensor 的训练场是一种 3D 棋盘游戏。 它本质上是一个类似于数独的单人游戏。 AI 必须以尽可能少的步骤将数字网格相乘,同时从无数允许的移动中进行选择——超过一万亿。

这些允许的移动被精心设计到 AlphaTensor 中。 在新闻发布会上,共同作者 Hussain Fawzi 博士解释说:“制定算法发现的空间非常复杂……更难的是,我们如何在这个空间中导航。”

换句话说,当面对一系列令人难以置信的选择时,我们如何缩小它们的范围以提高我们在大海捞针的机会? 我们如何才能最好地制定战略,而不用挖遍整个大海捞针?

团队纳入 AlphaTensor 的一个技巧是一种称为树搜索的方法。 打个比方,人工智能不是在干草堆中随机挖掘,而是探索可能导致更好结果的“道路”。 然后,中间学习帮助人工智能计划下一步行动,以增加成功的机会。 该团队还展示了成功游戏的算法样本,例如教孩子国际象棋的开局。 最后,一旦人工智能发现了有价值的动作,团队就会允许它重新排序这些操作,以便进行更量身定制的学习,以寻求更好的结果。

开拓新天地

AlphaTensor 打得很好。 在一系列测试中,该团队向 AI 提出了挑战,以找到最有效的解决方案,以解决最多为 XNUMX×XNUMX 的矩阵——即在一行或一列中各有五个数字。

该算法迅速重新发现了施特拉森最初的破解方法,但随后超越了人类先前设计的所有解决方案。 AlphaTensor 用不同大小的矩阵测试 AI,发现了 70 多个更有效的解决方案。“事实上,AlphaTensor 通常会为每种大小的矩阵发现数千种算法,”该团队说。 “真是令人难以置信。”

在一种情况下,将 80×76 矩阵与 919×896 XNUMX 相乘,AI 将之前 XNUMX 次单独乘法的记录减少到仅 XNUMX 次。它还适用于更大的矩阵,减少了两次所需的计算次数从 XNUMX 到 XNUMX 的 XNUMX×XNUMX 矩阵。

概念验证在手,团队转向实际使用。 计算机芯片通常设计用于优化不同的计算——例如用于图形的 GPU,或 用于机器学习的 AI 芯片——将算法与最适合的硬件相匹配可以提高效率。

在这里,该团队使用 AlphaTensor 为机器学习中两种流行的芯片寻找算法:NVIDIA V100 GPU 和 Google TPU。 总而言之,人工智能开发的算法将计算速度提高了 20%。

很难说人工智能是否也可以加速智能手机、笔记本电脑或其他日常设备。 然而,“如果可以将其用于实践,这一发展将非常令人兴奋,”麻省理工学院的弗吉尼亚·威廉姆斯博士说。 “性能的提升将改善很多应用程序。”

人工智能的思想

尽管 AlphaTensor 击败了矩阵乘法的最新人类记录,但 DeepMind 团队仍无法解释原因。

“通过玩这些游戏,它获得了这种惊人的直觉,”DeepMind 科学家和合著者 Pushmeet Kohli 博士在新闻发布会上说。

不断发展的算法也不一定是人与机器。

虽然 AlphaTensor 是迈向更快算法的垫脚石,但可能存在更快的算法。 “因为它需要将搜索限制在特定形式的算法上,它可能会错过其他可能更有效的算法,”Balog 和 Fawzi 写道。

也许更有趣的路径将结合人类和机器的直觉。 “很高兴弄清楚这种新方法是否真的包含了所有以前的方法,或者你是否可以将它们结合起来得到更好的东西,” 说过 威廉姆斯。 其他专家也同意。 有了丰富的算法供他们使用,科学家们可以开始剖析它们,寻找导致 AlphaTensor 解决方案有效的线索,为下一个突破铺平道路。

图片来源:DeepMind

时间戳记:

更多来自 奇异枢纽