人工智能发现椭圆曲线“杂音”起飞 |广达杂志

人工智能发现椭圆曲线“杂音”起飞 |广达杂志

人工智能发现椭圆曲线“杂音”起飞 |广达杂志柏拉图区块链数据智能。垂直搜索。人工智能。

介绍

椭圆曲线是现代数学中最迷人的对象之一。它们看起来并不复杂,但它们在许多人在高中学习的数学和最深奥的研究数学之间形成了一条高速公路。它们是 1990 世纪 2000 年代安德鲁·怀尔斯 (Andrew Wiles) 著名的费马大定理证明的核心。它们是现代密码学的关键工具。 XNUMX 年,克莱数学研究所命名了 关于统计的猜想 椭圆曲线是七个“千年奖问题”之一,每个问题的解决方案都将获得 1 万美元的奖金。这个猜想首先由 布莱恩·伯奇彼得·斯温纳顿-戴尔 到了1960世纪XNUMX年代,仍然没有得到证实。

理解椭圆曲线是一项高风险的工作,也是数学的核心。因此,在 2022 年,当跨大西洋合作使用统计技术和人工智能发现椭圆曲线中完全意想不到的模式时,这是一个受欢迎的贡献,尽管是出乎意料的。 “机器学习带着一些有趣的东西来到我们家门口只是时间问题,”说 彼得·萨纳克,普林斯顿大学高等研究院数学家。最初,没有人能够解释为什么新发现的模式存在。从那时起,在最近的一系列论文中,数学家们开始解开这些模式背后的原因,并开始证明它们不仅发生在特定的环境中,而且还开始证明它们不仅发生在特定的环境中,而且还开始证明它们不仅发生在2022 年检查的示例,但更普遍的是椭圆曲线。

椭圆形的重要性

为了理解这些模式是什么,我们必须为什么是椭圆曲线以及数学家如何对它们进行分类奠定一些基础。

椭圆曲线与一个变量的平方相关,通常写为 y,另一个的三次方,通常写为 x: y2 = x3 + Ax + B,对于一些数字对 AB, 只要 AB 满足一些简单的条件。该方程定义了一条可以在平面上绘制的曲线,如下所示。 (尽管名称相似,但椭圆不是椭圆曲线。)

介绍

尽管椭圆曲线看起来很普通,但对于数论学家(寻找整数模式的数学家)来说却是极其强大的工具。而不是让变量 xy 由于范围涵盖所有数字,数学家喜欢将它们限制在不同的数字系统中,他们称之为在给定数字系统“上”定义一条曲线。仅限于有理数(可以写成分数的数字)的椭圆曲线特别有用。 “实数或复数上的椭圆曲线非常无聊,”萨纳克说。 “只有有理数才是深奥的。”

这是正确的一种方式。如果在椭圆曲线上的两个有理点之间画一条直线,那么该线再次与曲线相交的地方也将是有理数。您可以使用该事实来定义椭圆曲线中的“加法”,如下所示。

介绍

之间画一条线 PQ。该线将在第三点与曲线相交, R。 (数学家有一个特殊的技巧来处理直线不与曲线相交的情况,即添加一个“无穷远点”。) R 跨越 x-axis 是你的总和 P + Q。与此加法运算一起,曲线的所有解形成一个称为群的数学对象。

数学家用它来定义曲线的“等级”。这 曲线的秩 与它拥有的有理解的数量有关。 Rank 0 曲线具有有限数量的解。具有较高秩的曲线具有无限多个解,这些解之间使用加法运算的关系由秩描述。

等级不太了解;数学家并不总有办法计算它们,也不知道它们能达到多大。 (已知特定曲线的最大精确等级是 20。)外观相似的曲线可以具有完全不同的等级。

椭圆曲线也与素数有很大关系,素数只能被 1 和它们本身整除。特别是,数学家研究有限域上的曲线——为每个素数定义的循环算术系统。有限域就像一个时钟,其小时数等于素数:如果继续向上计数,数字会重新开始。例如,在 7 的有限域中,5 加 2 等于 5,3 加 1 等于 XNUMX。

介绍

椭圆曲线有一个关联的数字序列,称为 ap,与由素数定义的有限域中的曲线的解数有关 p。 较小的 ap 意味着更多的解决方案;一个更大的 ap 意味着更少的解决方案。虽然排名很难计算,但顺序 ap 容易多了。

根据在最早的一台计算机上进行的大量计算,伯奇和斯温纳顿-戴尔推测了椭圆曲线的秩与序列之间的关系 ap。任何能够证明自己是对的人都将赢得一百万美元和数学上的不朽。

令人惊讶的模式出现

疫情开始后, 何阳辉伦敦数学科学研究所的研究员决定接受一些新的挑战。他在大学主修物理,并获得麻省理工学院数学物理博士学位。但他对数论越来越感兴趣,并且考虑到人工智能能力的不断增强,他认为他应该尝试使用人工智能作为寻找数字中意想不到的模式的工具。 (他已经 使用机器学习 分类 卡拉比-丘流形,弦理论中广泛使用的数学结构。)

介绍

2020年XNUMX月,随着疫情的加深,诺丁汉大学接待了他 网上谈话。他对自己的进展以及利用机器学习发现新数学的可能性感到悲观。 “他的叙述是数论很难,因为你无法用机​​器学习数论中的东西,”说 托马斯·奥利弗观众席上有一位威斯敏斯特大学的数学家。他回忆道:“我什么也没找到,因为我不是专家。我什至没有使用正确的东西来看待这个问题。”

奥利弗和 李圭焕康涅狄格大学的数学家开始与贺一起工作。 “我们决定这样做只是为了了解机器学习是什么,而不是认真研究数学,”奥利弗说。 “但我们很快发现你可以通过机器学习很多东西。”

奥利弗和李建议他应用他的技术来检查 L- 函数、通过序列与椭圆曲线密切相关的无穷级数 ap。他们可以使用椭圆曲线及其相关的在线数据库 L-称为的函数 LMF数据库 训练他们的机器学习分类器。当时,数据库中有超过 3 万条有理椭圆曲线。到 2020 年 XNUMX 月,他们已经 一篇论文 使用从收集的信息 L-预测椭圆曲线特定属性的函数。十一月他们分享了 另一篇论文 使用机器学习对数论中的其他对象进行分类。到 12 月,他们能够 预测椭圆曲线的等级 具有高精度。

但他们不确定为什么他们的机器学习算法运行得这么好。李询问他的本科生阿列克谢·波兹尼亚科夫(Alexey Pozdnyakov),看看他是否能弄清楚发生了什么事。事实上,LMFDB 根据称为导体的量对椭圆曲线进行排序,导体总结了曲线表现不佳的素数的信息。因此,Pozdnyakov 尝试同时查看大量具有相似导体的曲线 - 例如,导体数量在 7,500 到 10,000 之间的所有曲线。

介绍

总共约有 10,000 条曲线。其中大约一半的等级为 0,一半的等级为 1。(更高等级的情况极为罕见。)然后他对 ap 对于所有 0 级曲线,单独平均 ap 对于所有的 1 阶曲线,并绘制结果。两组点形成了两个截然不同的、易于辨别的波浪。这就是为什么机器学习分类器能够正确确定特定曲线的等级。

“一开始我只是为完成任务而感到高兴,”波兹德尼亚科夫说。 “但圭焕立即意识到这种模式令人惊讶,从那时起它就变得非常令人兴奋。”

李和奥利弗被迷住了。 “阿列克谢给我们看了这张照片,我说它看起来像鸟类所做的事情,”奥利弗说。 “然后圭焕查了一下,说这叫杂音,然后杨说我们应该给报纸打电话”椭圆曲线的杂音'”。

他们于 2022 年 XNUMX 月上传了论文,并将其转发给其他几位数学家,紧张地期待着被告知他们所谓的“发现”是众所周知的。奥利弗表示,这种关系如此明显,早就应该引起人们的注意。

介绍

预印本几乎立刻就引起了人们的兴趣,尤其是来自 安德鲁·萨瑟兰麻省理工学院的研究科学家,LMFDB 的执行编辑之一。 Sutherland 意识到 3 万条椭圆曲线不足以满足他的目的。他想观察更大的导体范围,看看杂音的强度有多大。他从另一个包含约 150 亿条椭圆曲线的巨大存储库中提取数据。他仍然不满意,然后从另一个存储库中提取了包含 300 亿条曲线的数据。

“但即使这些还不够,所以我实际上计算了超过十亿条椭圆曲线的新数据集,这就是我用来计算真正高分辨率图片的东西,”萨瑟兰说。这些杂音显示出他一次平均超过 15,000 条椭圆曲线,还是一次平均超过 XNUMX 万条。即使他观察越来越大的素数的曲线,形状仍然保持不变,这种现象称为尺度不变性。萨瑟兰还意识到,杂音并不是椭圆曲线所独有的,而且也出现在更普遍的曲线中。 L-功能。他写了 一封总结他的发现的信 并将其发送到沙纳克 迈克尔·鲁宾斯坦 在滑铁卢大学。

“如果有一个已知的解释,我希望你会知道,”萨瑟兰写道。

他们没有。

解释模式

Lee、He 和 Oliver 于 2023 年 XNUMX 月在布朗大学数学计算与实验研究所 (ICERM) 组织了一次关于杂音的研讨会。萨纳克和鲁宾斯坦来了,萨纳克的学生也来了 尼娜·祖布里娜.

Zubrilina 介绍了她对杂音模式的研究 模块化形式,特殊的复杂函数,如椭圆曲线,具有关联 L-功能。在具有大导体的模块化形式中,杂音会聚成清晰的曲线,而不是形成可辨别但分散的模式。在 一篇论文 Zubrilina 于 11 年 2023 月 XNUMX 日发布,证明这种类型的杂音遵循她发现的明确公式。

“尼娜的伟大成就在于她为此给出了一个公式;我称之为 Zubrilina 杂音密度公式,”Sarnak 说。 “使用非常复杂的数学,她证明了一个与数据完美契合的精确公式。”

她的公式很复杂,但萨纳克称赞它是一种重要的新型函数,可与艾里函数相媲美,艾里函数定义了从光学到量子力学等各种物理学领域中使用的微分方程的解。

尽管祖布里纳的公式是第一个,但其他人也纷纷效仿。 “现在每周都会发布一篇新论文,”Sarnak 说,“主要使用 Zubrilina 的工具,解释杂音的其他方面。”

乔纳森·鲍伯, 安德鲁·布克李敏 布里斯托大学,以及 大卫·洛瑞-杜达 ICERM 证明了模块化形式中不同类型的杂音的存在 另一篇十月论文。还有李奎焕、奥利弗和波兹德尼亚科夫 证明了存在 称为狄利克雷特征的物体中的杂音,这些特征与 L-职能。

萨瑟兰对发现杂音的巨大运气印象深刻。如果指挥员没有对椭圆曲线数据进行排序,杂音就会消失。 “他们很幸运能够从 LMFDB 获取数据,这些数据是根据售票员预先排序的,”他说。 “这就是将椭圆曲线与相应的模形式联系起来的原因,但这一点也不明显。 ......方程看起来非常相似的两条曲线可能具有非常不同的导体。”例如,萨瑟兰指出 y2 = x3 - 11x + 6 有导体 17,但将减号翻转为加号, y2 = x3 + 11x + 6 有导体 100,736。

即便如此,由于波兹德尼亚科夫缺乏经验,这些杂音还是被发现了。 “我认为,如果没有他,我们就不可能找到它,”奥利弗说,“因为专家们传统上将 ap 具有绝对值 1。但他没有将它们归一化……所以振荡非常大且明显。”

奥利弗指出,人工智能算法用于按等级对椭圆曲线进行排序的统计模式存在于具有数百个维度的参数空间中,数量太多,人们无法在脑海中进行排序,更不用说可视化了。但是,尽管机器学习发现了隐藏的振荡,“直到后来我们才明白它们是低语。”

编者注:Andrew Sutherland、Kyu-Hwan Lee 和 L 函数和模块化形式数据库 (LMFDB) 均获得了西蒙斯基金会的资助,该基金会也资助了这本编辑独立的出版物。西蒙斯基金会的资助决定对我们的报道没有影响。有更多信息可供参考 相关信息.

时间戳记:

更多来自 量子杂志