Еліптична крива «Мурмурації», знайдена за допомогою штучного інтелекту Take Flight | Журнал Quanta

Еліптична крива «Мурмурації», знайдена за допомогою штучного інтелекту Take Flight | Журнал Quanta

Elliptic Curve ‘Murmurations’ Found With AI Take Flight | Quanta Magazine PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Вступ

Еліптичні криві є одними з найбільш оманливих об’єктів у сучасній математиці. Вони не здаються складними, але утворюють швидкісну дорогу між математикою, яку багато людей вивчають у середній школі, та дослідницькою математикою в її найбільш незрозумілому вигляді. Вони були центральними у знаменитому доказі Ендрю Вайлза останньої теореми Ферма в 1990-х роках. Вони є ключовими інструментами сучасної криптографії. А в 2000 році Інститут математики Клея назвав а припущення щодо статистики еліптичних кривих, одна із семи «Проблем тисячоліття», кожна з яких несе премію в 1 мільйон доларів за своє вирішення. Це припущення, на яке вперше наважився Браян Берч та Пітер Свіннертон-Дайер у 1960-х роках, досі не було доведено.

Розуміння еліптичних кривих — це важке завдання, яке займало центральне місце в математиці. Тож у 2022 році, коли трансатлантична співпраця використовувала статистичні методи та штучний інтелект, щоб виявити абсолютно несподівані закономірності на еліптичних кривих, це був бажаний, хоча й несподіваний, внесок. «Це було лише питанням часу, коли машинне навчання з’явиться на нашому порозі з чимось цікавим», — сказав він Петро Сарнак, математик в Інституті перспективних досліджень і Прінстонському університеті. Спочатку ніхто не міг пояснити, чому існують нещодавно виявлені закономірності. Відтоді в серії нещодавніх робіт математики почали з’ясовувати причини закономірностей, які називаються «бурчаннями» за їхню схожість із рухливими формами зграї шпаків, і почали доводити, що вони мають виникати не лише в окремих приклади, розглянуті в 2022 році, але в еліптичних кривих більш загально.

Важливість бути еліптичним

Щоб зрозуміти, що це за закономірності, ми маємо закласти трохи фундаменту про те, що таке еліптичні криві та як математики їх класифікують.

Еліптична крива пов’язує квадрат однієї змінної, яку зазвичай записують як y, у третьому степені іншого, зазвичай записується як x: y2 = x3 + Ax + B, для деякої пари чисел A та BТих пір, поки A та B виконати кілька простих умов. Це рівняння визначає криву, яку можна побудувати на площині, як показано нижче. (Незважаючи на подібність назв, еліпс не є еліптичною кривою.)

Вступ

Незважаючи на звичайний вигляд, еліптичні криві виявилися неймовірно потужними інструментами для теоретиків чисел — математиків, які шукають закономірності в цілих числах. Замість того, щоб дозволяти змінним x та y в межах усіх чисел, математики люблять обмежувати їх різними системами числення, які вони називають визначенням кривої «над» даною системою числення. Особливо корисними є еліптичні криві, обмежені раціональними числами — числами, які можна записати у вигляді дробів. «Еліптичні криві над дійсними або комплексними числами досить нудні», — сказав Сарнак. «Глибокими є лише раціональні числа».

Ось один із способів, який є вірним. Якщо провести пряму лінію між двома раціональними точками на еліптичній кривій, місце, де ця лінія знову перетинає криву, також буде раціональним. Ви можете використовувати цей факт, щоб визначити «додавання» в еліптичній кривій, як показано нижче.

Вступ

Проведіть лінію між P та Q. Ця лінія перетне криву в третій точці, R. (Математики мають спеціальний трюк, щоб мати справу з випадком, коли лінія не перетинає криву, додаючи «точку на нескінченності».) Відображення R через x-вісь - ваша сума P + Q. Разом із цією операцією додавання всі розв’язки кривої утворюють математичний об’єкт, який називається групою.

Математики використовують це для визначення «рангу» кривої. The ранг кривої відноситься до кількості раціональних рішень, які він має. Криві рангу 0 мають скінченну кількість рішень. Криві з вищим рангом мають нескінченну кількість розв’язків, зв’язок яких один з одним за допомогою операції додавання описується рангом.

Ранги не дуже добре зрозумілі; математики не завжди мають спосіб їх обчислити і не знають, наскільки великими вони можуть стати. (Найбільший точний ранг, відомий для певної кривої, дорівнює 20.) Схожі на вигляд криві можуть мати абсолютно різні ранги.

Еліптичні криві також мають багато спільного з простими числами, які діляться лише на 1 і самі по собі. Зокрема, математики розглядають криві над скінченними полями — системами циклічної арифметики, які визначені для кожного простого числа. Скінченне поле схоже на годинник із кількістю годин, що дорівнює простому штибу: якщо ви продовжуєте рахувати вгору, цифри починаються спочатку. У скінченному полі для 7, наприклад, 5 плюс 2 дорівнює нулю, а 5 плюс 3 дорівнює 1.

Вступ

З еліптичною кривою пов’язана послідовність чисел, яка називається ap, що стосується кількості розв’язків кривої в кінцевому полі, визначеному штрихом p. Менший ap означає більше рішень; більший ap означає менше рішень. Хоча ранг важко обчислити, послідовність ap набагато легше.

На основі численних обчислень, виконаних на одному з найперших комп’ютерів, Бірч і Свіннертон-Дайєр припустили зв’язок між рангом еліптичної кривої та послідовністю ap. Кожен, хто зможе довести свою правоту, виграє мільйон доларів і математичне безсмертя.

Виявляється сюрприз

Після початку пандемії, Ян-Хуей Хе, дослідник Лондонського інституту математичних наук, вирішив взяти на себе нові завдання. Він вивчав фізику в коледжі та отримав докторський ступінь з математичної фізики в Массачусетському технологічному інституті. Але він дедалі більше цікавився теорією чисел, і, враховуючи зростаючі можливості штучного інтелекту, він думав, що спробує використати ШІ як інструмент для пошуку несподіваних закономірностей у числах. (Він уже був за допомогою машинного навчання класифікувати Многовиди Калабі-Яу, математичні структури, які широко використовуються в теорії струн.)

Вступ

У серпні 2020 року, коли пандемія поглибилася, Ноттінгемський університет прийняв його на онлайн розмова. Він песимістично дивився на свій прогрес і на саму можливість використання машинного навчання для відкриття нової математики. «Його розповідь полягала в тому, що теорія чисел була важкою, тому що в теорії чисел не можна вчитися машинним способом», — сказав Томас Олівер, математик з Вестмінстерського університету, який був в аудиторії. Як він згадує: «Я нічого не міг знайти, бо не був експертом. Я навіть не використовував правильні речі, щоб дивитися на це».

Олівер і Кю-Хван Лі, математик з Університету Коннектикуту, почав працювати з Хе. «Ми вирішили зробити це, щоб дізнатися, що таке машинне навчання, а не серйозно вивчати математику», — сказав Олівер. «Але ми швидко виявили, що багато речей можна навчити машиною».

Олівер і Лі запропонували Йому застосувати свої методи дослідження L-функції, нескінченні ряди тісно пов'язані з еліптичними кривими через послідовність ap. Вони могли б використовувати онлайнову базу даних еліптичних кривих та пов’язаних із ними L-функції, які називаються LMFDB навчити класифікаторів машинного навчання. На той час у базі даних було трохи більше 3 мільйонів еліптичних кривих над раціональними. До жовтня 2020 року вони були папір які використовували інформацію, отриману з L-функції для передбачення певної властивості еліптичних кривих. У листопаді поділилися інший папір які використовували машинне навчання для класифікації інших об’єктів у теорії чисел. До грудня вони змогли передбачити ранги еліптичних кривих з високою точністю.

Але вони не були впевнені, чому їхні алгоритми машинного навчання працюють так добре. Лі попросив свого студента Олексія Позднякова перевірити, чи зможе він зрозуміти, що відбувається. Як це трапляється, LMFDB сортує еліптичні криві відповідно до величини, яка називається провідником, яка підсумовує інформацію про прості числа, для яких крива не працює належним чином. Тож Поздняков намагався розглядати велику кількість кривих із подібними провідниками одночасно — скажімо, усі криві з провідниками від 7,500 до 10,000 XNUMX.

Вступ

Загалом це склало близько 10,000 0 кривих. Приблизно половина з них мала ранг 1, а половина — ранг XNUMX. (Вищі ранги зустрічаються надзвичайно рідко). Потім він усереднив значення ap для всіх кривих рангу 0, окремо усереднених ap для всіх кривих рангу 1 і побудував результати. Два набори точок утворили дві чіткі, легко помітні хвилі. Ось чому класифікатори машинного навчання змогли правильно визначити ранги окремих кривих.

«Спочатку я просто був щасливий, що виконав завдання», — сказав Поздняков. «Але Кю-Хван одразу зрозумів, що ця модель дивовижна, і тоді вона стала справді захоплюючою».

Лі та Олівер були в захваті. «Олексій показав нам фотографію, і я сказав, що вона схожа на те, що роблять птахи», — сказав Олівер. «І тоді Кю-Хван переглянув це і сказав, що це називається мурмуруванням, а потім Ян сказав, що ми повинні зателефонувати в газету»Шуміння еліптичних кривих. ''

Вони завантажили свою статтю у квітні 2022 року та надіслали її кільком іншим математикам, нервово очікуючи, що їм скажуть, що їхнє так зване «відкриття» добре відомо. Олівер сказав, що стосунки настільки помітні, що їх давно треба було помітити.

Вступ

Майже одразу препринт викликав інтерес, зокрема з боку Ендрю Сазерленд, науковий співробітник Массачусетського технологічного інституту, який є одним із керуючих редакторів LMFDB. Сазерленд зрозумів, що 3 мільйонів еліптичних кривих недостатньо для його цілей. Він хотів подивитися на набагато більші діапазони провідників, щоб побачити, наскільки надійними були шуми. Він витягнув дані з іншого величезного сховища приблизно 150 мільйонів еліптичних кривих. Все ще незадоволений, він потім отримав дані з іншого сховища з 300 мільйонами кривих.

«Але навіть цього виявилося недостатньо, тож я фактично обчислив новий набір даних із понад мільярда еліптичних кривих, і це те, що я використав для обчислення зображень дійсно високої роздільної здатності», — сказав Сазерленд. Шумування виявилося незалежно від того, чи в середньому він враховував більше 15,000 XNUMX еліптичних кривих за раз, чи за мільйон за раз. Форма залишалася незмінною, навіть коли він дивився на криві все більших і більших простих чисел, явище, яке називається незмінністю масштабу. Сазерленд також зрозумів, що шуми характерні не лише для еліптичних кривих, а й у більш загальному L-функції. Він написав лист із підсумком своїх висновків і відправив його в Сарнак і Михайло Рубінштейн в університеті Ватерлоо.

«Якщо цьому є відоме пояснення, я сподіваюся, ви його знатимете», — написав Сазерленд.

Вони цього не зробили.

Пояснення шаблону

У серпні 2023 року Лі, Хе та Олівер організували семінар з мурмурації в Інституті обчислювальних та експериментальних досліджень математики (ICERM) Університету Брауна. Прийшли Сарнак і Рубінштейн, учень Сарнака Ніна Зубриліна.

Зубриліна представила своє дослідження патернів мурмурування в модульні форми, спеціальні складні функції, які, як і еліптичні криві, мають асоційовані L-функції. У модульних формах з великими провідниками шуми сходяться в чітко окреслену криву, а не утворюють помітний, але розсіяний малюнок. в папір опубліковано 11 жовтня 2023 р., Зубриліна довела, що цей тип мурмурання слідує чіткій формулі, яку вона відкрила.

«Великим досягненням Ніни є те, що вона дала формулу для цього; Я називаю це формулою щільності шуму Зубриліної», — сказав Сарнак. «Використовуючи дуже складну математику, вона довела точну формулу, яка ідеально відповідає даним».

Її формула складна, але Сарнак вітає її як важливий новий вид функції, порівнянну з функціями Ейрі, які визначають розв’язки диференціальних рівнянь, що використовуються в різних контекстах фізики, починаючи від оптики і закінчуючи квантовою механікою.

Хоча формула Зубриліної була першою, за нею пішли інші. «Тепер щотижня виходить нова стаття, — сказав Сарнак, — у якій в основному використовуються інструменти Зубріліної та пояснюються інші аспекти мурмурації».

Джонатан Бобер, Ендрю Букер та Мін Лі Брістольського університету разом з Девід Лоурі-Дуда ICERM, довів існування іншого типу мурмурування в модульних формах у ще одна жовтнева газета. І Кю-Хван Лі, Олівер і Поздняков довів існування шумів в об'єктах, які називаються символами Діріхле, які тісно пов'язані з L-функції.

Сазерленд був вражений значною дозою удачі, яка призвела до відкриття мурмурацій. Якби дані еліптичної кривої не були впорядковані провідником, шуми зникли б. «Їм пощастило взяти дані з LMFDB, які були попередньо відсортовані відповідно до провідника», — сказав він. «Це те, що пов’язує еліптичну криву з відповідною модульною формою, але це зовсім не очевидно. … Дві криві, рівняння яких виглядають дуже схожими, можуть мати дуже різні провідники». Наприклад, Сазерленд зазначив, що y2 = x3 - 11x + 6 має провідник 17, але змінивши знак мінус на знак плюс, y2 = x3 + 11x + 6 має провідник 100,736 XNUMX.

Вже тоді шуми знайшли лише через недосвідченість Позднякова. «Я не думаю, що ми б знайшли це без нього, - сказав Олівер, - тому що експерти традиційно нормалізують ap мати абсолютне значення 1. Але він не нормалізував їх … тому коливання були дуже великими та помітними».

Статистичні шаблони, які використовують алгоритми штучного інтелекту для сортування еліптичних кривих за рангом, існують у просторі параметрів із сотнями вимірів — занадто багато, щоб люди могли відсортувати їх у своїй свідомості, не кажучи вже про візуалізацію, зазначив Олівер. Але хоча машинне навчання знайшло приховані коливання, «лише пізніше ми зрозуміли, що це шуми».

Примітка редактора: Ендрю Сазерленд, Кю-Хван Лі та база даних L-функцій і модульних форм (LMFDB) отримали фінансування від Фонду Саймонса, який також фінансує це незалежне від редакції видання. Рішення про фінансування Simons Foundation не впливають на наше висвітлення. Більше інформації доступно тут.

Часова мітка:

Більше від Квантамагазин