Elliptisk kurve 'Murmurations' fundet med AI Take Flight | Quanta Magasinet

Elliptisk kurve 'Murmurations' fundet med AI Take Flight | Quanta Magasinet

Elliptisk kurve 'Murmurations' fundet med AI Take Flight | Quanta Magazine PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Introduktion

Elliptiske kurver er blandt de mere forførende objekter i moderne matematik. De virker ikke komplicerede, men de danner en motorvej mellem den matematik, som mange mennesker lærer i gymnasiet, og forskning i matematik, når det er mest dystre. De var centrale i Andrew Wiles' berømte bevis på Fermats sidste sætning i 1990'erne. De er nøgleværktøjer i moderne kryptografi. Og i 2000 navngav Clay Mathematics Institute en formodninger om statistikken af elliptiske kurver et af syv "Millennium Prize Problemer", som hver bærer en præmie på $1 million for sin løsning. Den formodning, først vovede af Bryan Birch , Peter Swinnerton-Dyer i 1960'erne, er stadig ikke blevet bevist.

At forstå elliptiske kurver er en høj indsats, der har været central for matematik. Så i 2022, da et transatlantisk samarbejde brugte statistiske teknikker og kunstig intelligens til at opdage helt uventede mønstre i elliptiske kurver, var det et kærkomment, om end uventet, bidrag. "Det var bare et spørgsmål om tid, før maskinlæring landede på vores hoveddør med noget interessant," sagde Peter Sarnak, en matematiker ved Institute for Advanced Study og Princeton University. I første omgang kunne ingen forklare, hvorfor de nyopdagede mønstre eksisterer. Siden da er matematikere i en række nyere artikler begyndt at låse op for årsagerne bag mønstrene, kaldet "murmurering" for deres lighed med flydende former af flokkende stære, og er begyndt at bevise, at de ikke kun skal forekomme i det særlige eksempler undersøgt i 2022, men i elliptiske kurver mere generelt.

Vigtigheden af ​​at være elliptisk

For at forstå, hvad disse mønstre er, er vi nødt til at lægge et lille grundlag for, hvad elliptiske kurver er, og hvordan matematikere kategoriserer dem.

En elliptisk kurve relaterer kvadratet af en variabel, almindeligvis skrevet som y, til tredje potens af en anden, almindeligvis skrevet som x: y2 = x3 + Ax + B, for nogle par tal A , B, Så længe A , B opfylde nogle få enkle betingelser. Denne ligning definerer en kurve, der kan tegnes grafisk på planet, som vist nedenfor. (På trods af ligheden i navnene er en ellipse ikke en elliptisk kurve.)

Introduktion

Selvom de ser almindeligt ud, viser elliptiske kurver sig at være utroligt kraftfulde værktøjer for talteoretikere - matematikere, der leder efter mønstre i heltal. I stedet for at lade variablerne x , y rækkevidde over alle tal, vil matematikere gerne begrænse dem til forskellige talsystemer, som de kalder at definere en kurve "over" et givet talsystem. Elliptiske kurver begrænset til de rationelle tal - tal, der kan skrives som brøker - er særligt nyttige. "Elliptiske kurver over de reelle eller komplekse tal er ret kedelige," sagde Sarnak. "Det er kun de rationelle tal, der er dybe."

Her er en måde, hvorpå det er sandt. Hvis du tegner en ret linje mellem to rationelle punkter på en elliptisk kurve, vil stedet, hvor den linje igen skærer kurven, også være rationel. Du kan bruge dette faktum til at definere "addition" i en elliptisk kurve, som vist nedenfor.

Introduktion

Tegn en linje imellem P , Q. Den linje vil skære kurven ved et tredje punkt, R. (Matematikere har et særligt trick til at håndtere det tilfælde, hvor linjen ikke skærer kurven ved at tilføje et "punkt i uendeligheden.") Refleksionen af R over x-akse er din sum P + Q. Sammen med denne additionsoperation danner alle løsningerne til kurven et matematisk objekt kaldet en gruppe.

Matematikere bruger dette til at definere "rangen" af en kurve. Det rang af en kurve relaterer sig til antallet af rationelle løsninger, den har. Rank 0 kurver har et begrænset antal løsninger. Kurver med højere rangering har et uendeligt antal løsninger, hvis forhold til hinanden ved hjælp af additionsoperationen er beskrevet af rangordenen.

Rang er ikke godt forstået; matematikere har ikke altid en måde at beregne dem på og ved ikke, hvor store de kan blive. (Den største nøjagtige rangorden kendt for en specifik kurve er 20.) Lignende udseende kurver kan have helt forskellige rangordner.

Elliptiske kurver har også meget at gøre med primtal, som kun er delelige med 1 og sig selv. Især matematikere ser på kurver over endelige felter - systemer af cyklisk aritmetik, der er defineret for hvert primtal. Et begrænset felt er som et ur med antallet af timer lig med primtal: Hvis du bliver ved med at tælle opad, starter tallene forfra. I det endelige felt for 7, for eksempel, er 5 plus 2 lig med nul, og 5 plus 3 er lig med 1.

Introduktion

En elliptisk kurve har en tilhørende talrække, kaldet ap, som relaterer sig til antallet af løsninger der er til kurven i det endelige felt defineret af primtal p. En mindre ap betyder flere løsninger; en større ap betyder færre løsninger. Selvom rangen er svær at beregne, rækkefølgen ap er meget nemmere.

På grundlag af adskillige beregninger udført på en af ​​de allerførste computere, formodede Birch og Swinnerton-Dyer en sammenhæng mellem en elliptisk kurves rang og rækkefølgen ap. Enhver, der kan bevise, at de havde ret, kan vinde en million dollars og matematisk udødelighed.

Et overraskelsesmønster dukker op

Efter pandemiens start, Yang-Hui He, en forsker ved London Institute for Mathematical Sciences, besluttede at påtage sig nogle nye udfordringer. Han havde været fysikstuderende på college og havde fået sin doktorgrad fra Massachusetts Institute of Technology i matematisk fysik. Men han var i stigende grad interesseret i talteori, og i betragtning af de stigende muligheder for kunstig intelligens, troede han, at han ville prøve sig frem med at bruge AI som et værktøj til at finde uventede mønstre i tal. (Det havde han allerede været ved hjælp af maskinlæring at klassificere Calabi-Yau manifolder, matematiske strukturer, der er meget brugt i strengteori.)

Introduktion

I august 2020, da pandemien forværredes, var University of Nottingham vært for ham for en online snak. Han var pessimistisk over sine fremskridt, og om selve muligheden for at bruge maskinlæring til at afdække ny matematik. "Hans fortælling var, at talteori var svær, fordi man ikke kunne maskinlære ting i talteori," sagde Thomas Oliver, en matematiker ved University of Westminster, der var blandt publikum. Som han husker: ”Jeg kunne ikke finde noget, fordi jeg ikke var ekspert. Jeg brugte ikke engang de rigtige ting til at se på det her."

Oliver og Kyu-Hwan Lee, en matematiker ved University of Connecticut, begyndte at arbejde med He. "Vi besluttede at gøre dette bare for at lære, hvad maskinlæring var, snarere end for seriøst at studere matematik," sagde Oliver. "Men vi fandt hurtigt ud af, at man kunne maskinlære en masse ting."

Oliver og Lee foreslog, at han brugte sine teknikker til at undersøge L-funktioner, uendelige rækker tæt forbundet med elliptiske kurver gennem sekvensen ap. De kunne bruge en online database med elliptiske kurver og deres relaterede L-funktioner kaldet LMFDB at træne deres maskinlæringsklassifikatorer. På det tidspunkt havde databasen lidt over 3 millioner elliptiske kurver over rationalerne. I oktober 2020 havde de et papir som brugte information hentet fra L-funktioner til at forudsige en bestemt egenskab ved elliptiske kurver. I november delte de et andet papir der brugte maskinlæring til at klassificere andre objekter i talteori. I december kunne de det forudsige rækken af ​​elliptiske kurver med høj nøjagtighed.

Men de var ikke sikre på, hvorfor deres maskinlæringsalgoritmer fungerede så godt. Lee spurgte sin bachelorstuderende Alexey Pozdnyakov for at se, om han kunne finde ud af, hvad der foregik. Som det sker, sorterer LMFDB elliptiske kurver efter en størrelse kaldet lederen, som opsummerer information om primtal, for hvilke en kurve ikke opfører sig godt. Så Pozdnyakov prøvede at se på et stort antal kurver med lignende ledere samtidigt - for eksempel alle kurverne med ledere mellem 7,500 og 10,000.

Introduktion

Dette udgjorde omkring 10,000 kurver i alt. Omkring halvdelen af ​​disse havde rang 0, og halvdelen rang 1. (Højere rækker er overordentlig sjældne.) Han tog derefter gennemsnittet af værdierne af ap for alle rang 0-kurverne, separat gennemsnittet ap for alle rang 1-kurverne og plottede resultaterne. De to sæt prikker dannede to distinkte, let genkendelige bølger. Det var derfor, maskinlæringsklassifikatorerne havde været i stand til korrekt at fastslå rækkerne af bestemte kurver.

"Først var jeg bare glad for, at jeg havde fuldført opgaven," sagde Pozdnyakov. "Men Kyu-Hwan erkendte straks, at dette mønster var overraskende, og det var da, det blev rigtig spændende."

Lee og Oliver var begejstrede. "Alexey viste os billedet, og jeg sagde, at det ligner den ting, som fugle gør," sagde Oliver. "Og så slog Kyu-Hwan det op og sagde, at det hedder en mumlen, og så sagde Yang, at vi skulle ringe til avisen"Mumlen af ​​elliptiske kurver. '”

De uploadede deres papir i april 2022 og videresendte det til en håndfuld andre matematikere og forventede nervøst at få at vide, at deres såkaldte "opdagelse" var velkendt. Oliver sagde, at forholdet var så synligt, at det burde have været bemærket for længe siden.

Introduktion

Næsten med det samme vakte fortrykket interesse, især fra Andrew Sutherland, en forsker ved MIT, som er en af ​​de administrerende redaktører af LMFDB. Sutherland indså, at 3 millioner elliptiske kurver ikke var nok til hans formål. Han ville se på meget større lederområder for at se, hvor robuste mumlen var. Han trak data fra et andet enormt lager med omkring 150 millioner elliptiske kurver. Stadig utilfreds hentede han data fra et andet depot med 300 millioner kurver.

"Men selv de var ikke nok, så jeg beregnede faktisk et nyt datasæt på over en milliard elliptiske kurver, og det var det, jeg brugte til at beregne de virkelig højopløselige billeder," sagde Sutherland. Mumlen viste sig, om han i gennemsnit havde over 15,000 elliptiske kurver ad gangen eller en million ad gangen. Formen forblev den samme, selvom han så på kurverne over større og større primtal, et fænomen kaldet skalainvarians. Sutherland indså også, at mumlen ikke er unikke for elliptiske kurver, men også forekommer mere generelt L-funktioner. Han skrev et brev, der opsummerer hans resultater og sendte det til Sarnak og Michael Rubinstein ved University of Waterloo.

"Hvis der er en kendt forklaring på det, forventer jeg, at du vil vide det," skrev Sutherland.

Det gjorde de ikke.

Forklaring af mønsteret

Lee, He og Oliver organiserede en workshop om murmurering i august 2023 på Brown University's Institute for Computational and Experimental Research in Mathematics (ICERM). Sarnak og Rubinstein kom, ligesom Sarnaks elev Nina Zubrilina.

Zubrilina præsenterede sin forskning i mumlemønstre i modulære former, særlige komplekse funktioner, der ligesom elliptiske kurver har tilknyttet L-funktioner. I modulære former med store ledere konvergerer mumlen til en skarpt defineret kurve i stedet for at danne et mærkbart, men spredt mønster. I et papir offentliggjort den 11. oktober 2023, beviste Zubrilina, at denne type mumlen følger en eksplicit formel, hun opdagede.

“Ninas store præstation er, at hun har givet en formel for dette; Jeg kalder det Zubrilina mumlen tæthed-formlen," sagde Sarnak. "Ved at bruge meget sofistikeret matematik har hun bevist en nøjagtig formel, som passer perfekt til dataene."

Hendes formel er kompliceret, men Sarnak hylder den som en vigtig ny slags funktion, der kan sammenlignes med de luftige funktioner, der definerer løsninger på differentialligninger, der bruges i en række forskellige sammenhænge i fysik, lige fra optik til kvantemekanik.

Selvom Zubrilinas formel var den første, har andre fulgt efter. "Hver uge nu, er der et nyt papir ude," sagde Sarnak, "hovedsageligt ved at bruge Zubrilinas værktøjer, der forklarer andre aspekter af mumlen."

Jonathan Bober, Andrew Booker , Min lee fra University of Bristol sammen med David Lowry-Duda af ICERM, beviste eksistensen af ​​en anden type mumlen i modulære former i endnu et oktoberblad. Og Kyu-Hwan Lee, Oliver og Pozdnyakov beviste eksistensen af mumlen i objekter kaldet Dirichlet-karakterer, der er nært beslægtet med L-funktioner.

Sutherland var imponeret over den betydelige dosis held, der havde ført til opdagelsen af ​​mumlen. Hvis de elliptiske kurvedata ikke var blevet bestilt af dirigenten, ville mumlen være forsvundet. "De var heldige at tage data fra LMFDB, som kom forudsorteret ifølge konduktøren," sagde han. "Det er det, der relaterer en elliptisk kurve til den tilsvarende modulære form, men det er slet ikke indlysende. ... To kurver, hvis ligninger ligner meget, kan have meget forskellige ledere." For eksempel bemærkede Sutherland det y2 = x3 - 11x + 6 har leder 17, men vender minustegnet til et plustegn, y2 = x3 + 11x + 6 har leder 100,736.

Selv dengang blev mumlen kun fundet på grund af Pozdnyakovs uerfarenhed. "Jeg tror ikke, vi ville have fundet det uden ham," sagde Oliver, "fordi eksperterne traditionelt normaliserer ap at have absolut værdi 1. Men han normaliserede dem ikke … så svingningerne var meget store og synlige.”

De statistiske mønstre, som AI-algoritmer bruger til at sortere elliptiske kurver efter rang, findes i et parameterrum med hundredvis af dimensioner - for mange til, at folk kan sortere igennem i deres sind, endsige visualisere, bemærkede Oliver. Men selvom maskinlæring fandt de skjulte svingninger, "forstod vi først senere, at de var mumlen."

Redaktørens note: Andrew Sutherland, Kyu-Hwan Lee og L-functions and modular forms databasen (LMFDB) har alle modtaget støtte fra Simons Foundation, som også finansierer denne redaktionelt uafhængige publikation. Simons Fondens finansieringsbeslutninger har ingen indflydelse på vores dækning. Mere information er tilgængelig link..

Tidsstempel:

Mere fra Quantamagazin