Elliptisen käyrän "ääniä" löydetty tekoälyn avulla Take Flight | Quanta-lehti

Elliptisen käyrän "ääniä" löydetty tekoälyn avulla Take Flight | Quanta-lehti

Elliptisen käyrän "ääniä" löydetty tekoälyn avulla Take Flight | Quanta Magazine PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

esittely

Elliptiset käyrät ovat modernin matematiikan houkuttelevampia kohteita. Ne eivät vaikuta monimutkaisilta, mutta ne muodostavat pikatien matematiikan, jota monet ihmiset oppivat lukiossa, ja tutkimusmatematiikan välillä sen hankalimmillaan. Ne olivat keskeisiä Andrew Wilesin tunnetussa todistuksessa Fermatin viimeisestä lauseesta 1990-luvulla. Ne ovat keskeisiä työkaluja nykyaikaisessa kryptografiassa. Ja vuonna 2000 Clay Mathematics Institute nimesi a oletuksia tilastoista elliptisten käyrien yksi seitsemästä "Millennium Prize -ongelmasta", joista jokainen tuo ratkaisustaan ​​miljoonan dollarin palkinnon. Se olettamus, jonka ensin uskaltautui Bryan Birch ja Peter Swinnerton-Dyer 1960-luvulla, ei ole vieläkään todistettu.

Elliptisten käyrien ymmärtäminen on suuri panos, joka on ollut keskeistä matematiikassa. Joten vuonna 2022, kun transatlanttinen yhteistyö käytti tilastotekniikoita ja tekoälyä löytääkseen täysin odottamattomia kuvioita elliptisistä käyristä, se oli tervetullut, joskin odottamaton, panos. "Se oli vain ajan kysymys, ennen kuin koneoppiminen saapui etuovellemme jotain mielenkiintoista", sanoi Peter Sarnak, matemaatikko Institute for Advanced Studyssa ja Princetonin yliopistossa. Aluksi kukaan ei osannut selittää, miksi juuri löydetyt kuviot ovat olemassa. Siitä lähtien matemaatikot ovat useissa viimeaikaisissa kirjoissa alkaneet paljastaa syitä kuvioiden taustalla, ja niitä on kutsuttu "murminaksi" niiden samankaltaisuuden vuoksi parveilevien kottaraisten nestemäisten muotojen kanssa, ja ovat alkaneet todistaa, että niitä ei tarvitse esiintyä vain tietyissä vuonna 2022 tarkasteltuja esimerkkejä, mutta yleisemmin elliptisissä käyrissä.

Elliptisen olemisen tärkeys

Ymmärtääksemme, mitä nämä kuviot ovat, meidän on luotava vähän pohjaa sille, mitä elliptiset käyrät ovat ja miten matemaatikot luokittelevat ne.

Elliptinen käyrä viittaa yhden muuttujan neliöön, joka yleensä kirjoitetaan muodossa y, toisen kolmanteen potenssiin, joka yleensä kirjoitetaan nimellä x: y2 = x3 + Ax + B, joillekin numeropareille A ja B, Niin kauan kuin A ja B täytä muutama yksinkertainen ehto. Tämä yhtälö määrittelee käyrän, joka voidaan piirtää tasolle alla olevan kuvan mukaisesti. (Huolimatta nimien samankaltaisuudesta, ellipsi ei ole elliptinen käyrä.)

esittely

Vaikka elliptiset käyrät näyttävät yksinkertaisilta, ne osoittautuvat uskomattoman tehokkaiksi työkaluiksi lukuteoreetikoille – matemaatikoille, jotka etsivät kuvioita kokonaisluvuista. Sen sijaan, että antaisit muuttujat x ja y matemaatikot haluavat rajoittaa ne erilaisiin lukujärjestelmiin, joita he kutsuvat "käyrän" määrittämiseksi tietyn numerojärjestelmän yli. Elliptiset käyrät, jotka on rajoitettu rationaalilukuihin – luvut, jotka voidaan kirjoittaa murtolukuina – ovat erityisen hyödyllisiä. "Elliptiset käyrät reaali- tai kompleksilukujen yläpuolella ovat melko tylsiä", Sarnak sanoi. "Vain rationaaliset luvut ovat syviä."

Tässä on yksi tapa, joka on totta. Jos piirrät suoran kahden elliptisen käyrän rationaalisen pisteen välille, paikka, jossa tämä viiva leikkaa käyrän uudelleen, on myös rationaalinen. Voit käyttää tätä tosiasiaa määrittämään "lisäyksen" elliptisessä käyrässä alla olevan kuvan mukaisesti.

esittely

Piirrä viiva väliin P ja Q. Tuo viiva leikkaa käyrän kolmannessa pisteessä, R. (Matemaatikoilla on erityinen temppu käsitellä tapausta, jossa viiva ei leikkaa käyrää lisäämällä "pisteen äärettömyyteen".) Heijastus R poikki x-akseli on summasi P + Q. Yhdessä tämän summausoperaation kanssa kaikki käyrän ratkaisut muodostavat matemaattisen objektin, jota kutsutaan ryhmäksi.

Matemaatikot käyttävät tätä määrittelemään käyrän "luokituksen". The käyrän arvo liittyy sen rationaalisten ratkaisujen määrään. Rankin 0 käyrillä on äärellinen määrä ratkaisuja. Käyrillä, joilla on korkeampi arvo, on ääretön määrä ratkaisuja, joiden suhdetta toisiinsa summausoperaatiota käyttämällä kuvataan arvolla.

Arvoja ei ymmärretä hyvin; matemaatikoilla ei aina ole tapaa laskea niitä, eivätkä he tiedä, kuinka suuriksi he voivat kasvaa. (Suurin tarkka, tietystä käyrästä tunnettu arvo on 20.) Samannäköisillä käyrillä voi olla täysin erilaisia ​​arvoja.

Elliptisillä käyrillä on myös paljon tekemistä alkulukujen kanssa, jotka ovat jaollisia vain 1:llä ja itsellään. Erityisesti matemaatikot tarkastelevat käyriä äärellisten kenttien yli – syklisen aritmeettisen järjestelmän, joka on määritelty kullekin alkuluvulle. Äärillinen kenttä on kuin kello, jonka tuntien määrä on yhtä suuri kuin alkuluku: Jos jatkat laskemista ylöspäin, luvut alkavat alusta. Esimerkiksi luvun 7 äärellisessä kentässä 5 plus 2 on nolla ja 5 plus 3 on 1.

esittely

Elliptiseen käyrään liittyy numerosarja, jota kutsutaan ap, joka liittyy alkuluvun määrittelemän äärellisen kentän käyrän ratkaisujen määrään p. Pienempi ap tarkoittaa enemmän ratkaisuja; isompi ap tarkoittaa vähemmän ratkaisuja. Vaikka sijoitusta on vaikea laskea, järjestystä ap on paljon helpompaa.

Yhdellä ensimmäisistä tietokoneista tehtyjen lukuisten laskelmien perusteella Birch ja Swinnerton-Dyer arvelivat elliptisen käyrän järjestyksen välisen suhteen. ap. Jokainen, joka voi todistaa olevansa oikeassa, voi voittaa miljoonan dollarin ja matemaattisen kuolemattomuuden.

Yllätyskuvio ilmestyy

Pandemian alkamisen jälkeen Yang-Hui HeLondon Institute for Mathematical Sciences -instituutin tutkija päätti ottaa vastaan ​​uusia haasteita. Hän oli opiskellut fysiikan pääaineenaan korkeakoulussa, ja hän oli suorittanut tohtorin tutkinnon Massachusetts Institute of Technologysta matemaattisesta fysiikasta. Mutta hän oli yhä enemmän kiinnostunut lukuteoriasta, ja tekoälyn lisääntyvien kykyjen vuoksi hän ajatteli kokeilla tekoälyä työkaluna odottamattomien numeromallien löytämiseen. (Hän oli jo ollut koneoppimisen avulla luokitellaan Calabi-Yau jakoputket, matemaattisia rakenteita, joita käytetään laajalti merkkijonoteoriassa.)

esittely

Elokuussa 2020 pandemian syventyessä Nottinghamin yliopisto isännöi hänet verkkopuhelu. Hän oli pessimistinen edistymisestään ja mahdollisuudesta käyttää koneoppimista uuden matematiikan löytämiseen. "Hänen kertomus oli, että lukuteoria oli vaikeaa, koska lukuteoriassa ei voinut koneoppia asioita", sanoi. Thomas Oliver, matemaatikko Westminsterin yliopistosta, joka oli yleisössä. Kuten Hän muistaa: ”En löytänyt mitään, koska en ollut asiantuntija. En edes käyttänyt oikeita asioita katsoakseni tätä."

Oliver ja Kyu-Hwan Lee, matemaatikko Connecticutin yliopistosta, aloitti työskentelyn He. "Päätimme tehdä tämän vain oppiaksemme, mitä koneoppiminen on, sen sijaan, että opiskelisimme vakavasti matematiikkaa", Oliver sanoi. "Mutta huomasimme nopeasti, että voit koneella oppia monia asioita."

Oliver ja Lee ehdottivat, että Hän soveltaisi tekniikoitaan tutkiakseen L-funktiot, äärettömät sarjat, jotka liittyvät läheisesti elliptisiin käyriin sekvenssin kautta ap. He voisivat käyttää online-tietokantaa elliptisistä käyristä ja niihin liittyvistä L-toiminnot nimeltä LMFDB kouluttaakseen koneoppimisluokittajiaan. Tuolloin tietokannassa oli hieman yli 3 miljoonaa elliptistä käyrää rationaalien yli. Lokakuuhun 2020 mennessä heillä oli paperi jotka käyttivät poimittua tietoa L-funktiot ennustavat elliptisten käyrien tietyn ominaisuuden. Marraskuussa he jakoivat toinen paperi joka käytti koneoppimista luokittelemaan muita kohteita lukuteoriassa. Joulukuuhun mennessä he pystyivät ennustaa elliptisten käyrien arvot suurella tarkkuudella.

Mutta he eivät olleet varmoja, miksi heidän koneoppimisalgoritminsa toimivat niin hyvin. Lee pyysi perustutkinto-opiskelijaansa Aleksei Pozdnyakovia katsomaan, voisiko hän selvittää, mitä oli tekeillä. LMFDB lajittelee elliptiset käyrät johtimeksi kutsutun suuren mukaan, joka tiivistää tiedot alkuluvuista, joille käyrä ei toimi hyvin. Joten Pozdnyakov yritti tarkastella suuria määriä käyriä samanlaisilla johtimilla samanaikaisesti – esimerkiksi kaikkia käyriä, joissa johtimia oli välillä 7,500-10,000.

esittely

Tämä oli yhteensä noin 10,000 0 käyrää. Noin puolet näistä oli 1- ja puolet XNUMX. (Korkeammat sijoitukset ovat erittäin harvinaisia.) Sitten hän laski arvot ap kaikille 0-sijoituskäyrille, erikseen laskettu keskiarvo ap kaikille rank 1 käyrälle ja piirsi tulokset. Kaksi pistejoukkoa muodostivat kaksi erillistä, helposti havaittavaa aaltoa. Tästä syystä koneoppimisen luokittelijat olivat pystyneet määrittämään tiettyjen käyrien arvot oikein.

"Aluksi olin vain iloinen, että sain tehtävän valmiiksi", Pozdnyakov sanoi. "Mutta Kyu-Hwan huomasi heti, että tämä kuvio oli yllättävä, ja silloin siitä tuli todella jännittävää."

Lee ja Oliver olivat innoissaan. "Aleksey näytti meille kuvan, ja sanoin, että se näyttää siltä, ​​mitä linnut tekevät", Oliver sanoi. "Ja sitten Kyu-Hwan katsoi sen ja sanoi, että sitä kutsutaan nurinaksi, ja sitten Yang sanoi, että meidän pitäisi soittaa lehteen.Elliptisten käyrien murinat. '”

He latasivat paperinsa huhtikuussa 2022 ja välittivät sen kouralliselle muille matemaatikoille odottaen hermostuneesti, että heille kerrottaisiin, että heidän niin sanottu "löytönsä" oli hyvin tiedossa. Oliver sanoi, että suhde oli niin näkyvä, että se olisi pitänyt huomata jo kauan sitten.

esittely

Esipainatus herätti lähes välittömästi kiinnostusta, erityisesti Andrew Sutherland, MIT:n tutkija, joka on yksi LMFDB:n päätoimittajista. Sutherland tajusi, että 3 miljoonaa elliptistä käyrää eivät riittäneet hänen tarkoituksiinsa. Hän halusi katsoa paljon suurempia johtimien etäisyyksiä nähdäkseen kuinka voimakkaita sivuäänet olivat. Hän poimi tietoja toisesta valtavasta noin 150 miljoonan elliptisen käyrän arkistosta. Edelleen tyytymättömänä hän otti sitten tietoja toisesta arkistosta 300 miljoonalla käyrällä.

"Mutta edes ne eivät riittäneet, joten itse asiassa lasken uuden yli miljardin elliptisen käyrän datajoukon, ja sitä käytin laskeessani todella korkearesoluutioisia kuvia", Sutherland sanoi. Murinat paljastivat, oliko hänellä keskimäärin yli 15,000 XNUMX elliptistä käyrää kerrallaan vai miljoona kerrallaan. Muoto pysyi samana, vaikka hän katsoi käyriä suurempien ja suurempien alkulukujen yli, ilmiötä kutsutaan asteikkoinvarianssiksi. Sutherland ymmärsi myös, että sivuäänet eivät ole ainutlaatuisia elliptisille käyrille, vaan ne näkyvät myös yleisemmin L-toiminnot. Hän kirjoitti kirje, jossa on yhteenveto hänen havainnoistaan ja lähetti sen Sarnakille ja Michael Rubinstein Waterloon yliopistossa.

"Jos sille on tunnettu selitys, odotan sinun tietävän sen", Sutherland kirjoitti.

He eivät tehneet.

Kuvion selittäminen

Lee, He ja Oliver järjestivät sivuäänistä työpajan elokuussa 2023 Brownin yliopiston matematiikan laskennallisen ja kokeellisen tutkimuksen instituutissa (ICERM). Sarnak ja Rubinstein tulivat, samoin kuin Sarnakin oppilas Nina Zubrilina.

Zubrilina esitteli sivuääniä koskevaa tutkimustaan ​​vuonna modulaariset muodot, erityisiä monimutkaisia ​​toimintoja, jotka, kuten elliptiset käyrät, ovat yhdistäneet L-toiminnot. Modulaarisissa muodoissa, joissa on suuria johtimia, sivuäänet konvergoivat jyrkästi määritellyksi käyräksi sen sijaan, että ne muodostaisivat havaittavan, mutta hajallaan olevan kuvion. Sisään paperi julkaistiin 11. lokakuuta 2023, Zubrilina osoitti, että tämäntyyppinen sivuääni noudattaa hänen löytämänsä eksplisiittistä kaavaa.

”Ninan suuri saavutus on, että hänelle on annettu kaava tähän; Kutsun sitä Zubrilinan sivuäänen tiheyskaavaksi", Sarnak sanoi. "Hän on osoittanut erittäin hienostuneen matematiikan avulla tarkan kaavan, joka sopii täydellisesti dataan."

Hänen kaavansa on monimutkainen, mutta Sarnak pitää sitä tärkeänä uudenlaisena funktiona, joka on verrattavissa Airy-funktioihin, jotka määrittelevät ratkaisuja erilaisissa fysiikan yhteyksissä käytettäviin differentiaaliyhtälöihin optiikasta kvanttimekaniikkaan.

Vaikka Zubrilinan kaava oli ensimmäinen, muut ovat seuranneet. "Joka viikko nyt ilmestyy uusi paperi", Sarnak sanoi, "lähinnä Zubrilinan työkaluilla selittäen sivuäänien muita näkökohtia."

Jonathan Bober, Andrew Booker ja Min Lee Bristolin yliopistosta yhdessä David Lowry-Duda ICERM, osoitti erityyppisen sivuäänen olemassaolon modulaarisissa muodoissa toinen lokakuun lehti. Ja Kyu-Hwan Lee, Oliver ja Pozdnyakov todisti olemassaolon sivuäänistä kohteissa, joita kutsutaan Dirichlet-hahmoiksi ja jotka liittyvät läheisesti L-toiminnot.

Sutherland teki vaikutuksen merkittävästä onnenannoksesta, joka oli johtanut sivuäänien löytämiseen. Jos elliptisen käyrän dataa ei olisi tilannut johdin, sivuäänet olisivat hävinneet. "Heillä oli onni, että he ottivat tiedot LMFDB:stä, jotka tulivat etukäteen lajiteltuina konduktöörin mukaan", hän sanoi. ”Se yhdistää elliptisen käyrän vastaavaan modulaariseen muotoon, mutta se ei ole ollenkaan itsestään selvää. … Kahdella käyrällä, joiden yhtälöt näyttävät hyvin samanlaisilta, voi olla hyvin erilaisia ​​johtimia. Esimerkiksi Sutherland totesi sen y2 = x3 - 11x + 6:ssa on johdin 17, mutta miinusmerkin kääntäminen plusmerkiksi, y2 = x3 + 11x + 6:ssa on johdin 100,736 XNUMX.

Silloinkin sivuäänet löydettiin vain Pozdnyakovin kokemattomuuden vuoksi. "En usko, että olisimme löytäneet sitä ilman häntä", Oliver sanoi, "koska asiantuntijat perinteisesti normalisoivat ap saada itseisarvo 1. Mutta hän ei normalisoinut niitä… joten heilahtelut olivat hyvin suuria ja näkyviä.”

Tilastolliset mallit, joita tekoälyalgoritmit käyttävät elliptisten käyrien lajittelemiseen arvon mukaan, ovat parametriavaruudessa, jossa on satoja ulottuvuuksia – liian monta, jotta ihmiset voisivat lajitella niitä mielessään, saati visualisoida, Oliver huomautti. Mutta vaikka koneoppiminen löysi piilotetut värähtelyt, "vasta myöhemmin ymmärsimme niiden olevan sivuääniä".

Toimittajan huomautus: Andrew Sutherland, Kyu-Hwan Lee ja L-funktioiden ja modulaaristen muotojen tietokanta (LMFDB) ovat kaikki saaneet rahoitusta Simons Foundationilta, joka rahoittaa myös tätä toimituksellisesti riippumatonta julkaisua. Simons Foundationin rahoituspäätökset eivät vaikuta kattavuuteemme. Lisätietoja on saatavilla tätä.

Aikaleima:

Lisää aiheesta Kvantamagatsiini