„Murmurații” de curbă eliptică găsite cu AI Take Flight | Revista Quanta

„Murmurații” de curbă eliptică găsite cu AI Take Flight | Revista Quanta

Elliptic Curve ‘Murmurations’ Found With AI Take Flight | Quanta Magazine PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Introducere

Curbele eliptice sunt printre cele mai atrăgătoare obiecte din matematica modernă. Nu par complicate, dar formează o cale rapidă între matematica pe care mulți oameni o învață în liceu și matematica de cercetare la cea mai abstrusă. Ele au fost esențiale pentru celebra demonstrație a ultimei teoreme a lui Fermat a lui Andrew Wiles în anii 1990. Sunt instrumente cheie în criptografia modernă. Și în 2000, Institutul de Matematică Clay a numit un presupuneri despre statistici de curbe eliptice una dintre cele șapte „probleme ale premiului mileniului”, fiecare dintre ele are un premiu de 1 milion de dolari pentru soluția sa. Acea presupunere, aventurată mai întâi de Bryan Birch și Peter Swinnerton-Dyer în anii 1960, încă nu a fost dovedit.

Înțelegerea curbelor eliptice este un efort cu mize mari care a fost esențial pentru matematică. Așadar, în 2022, când o colaborare transatlantică a folosit tehnici statistice și inteligență artificială pentru a descoperi modele complet neașteptate în curbele eliptice, a fost o contribuție binevenită, chiar dacă neașteptată. „A fost doar o chestiune de timp până când învățarea automată a aterizat pe pragul nostru cu ceva interesant”, a spus Peter Sarnak, matematician la Institutul pentru Studii Avansate și Universitatea Princeton. Inițial, nimeni nu a putut explica de ce există modelele nou descoperite. De atunci, într-o serie de lucrări recente, matematicienii au început să dezvăluie motivele din spatele tiparelor, numite „murmurații” pentru asemănarea lor cu formele fluide ale graurilor care se înmulțesc, și au început să demonstreze că acestea trebuie să apară nu numai în anumite zone. exemple examinate în 2022, dar în curbe eliptice în general.

Importanța de a fi eliptică

Pentru a înțelege care sunt aceste modele, trebuie să punem câteva baze despre ce sunt curbele eliptice și cum le clasifică matematicienii.

O curbă eliptică raportează pătratul unei variabile, scrisă în mod obișnuit ca y, la a treia putere a altuia, scrisă în mod obișnuit ca x: y2 = x3 + Ax + B, pentru o pereche de numere A și B, Atâta timp cât A și B îndeplini câteva condiții simple. Această ecuație definește o curbă care poate fi reprezentată grafic pe plan, așa cum se arată mai jos. (În ciuda similitudinii dintre nume, o elipsă nu este o curbă eliptică.)

Introducere

Deși cu aspect simplu, curbele eliptice se dovedesc a fi instrumente incredibil de puternice pentru teoreticienii numerelor - matematicieni care caută modele în numerele întregi. În loc să lași variabilele x și y variază peste toate numerele, matematicienilor le place să le limiteze la diferite sisteme de numere, pe care le numesc definirea unei curbe „peste” un anumit sistem de numere. Curbele eliptice limitate la numerele raționale - numere care pot fi scrise ca fracții - sunt deosebit de utile. „Curbele eliptice asupra numerelor reale sau complexe sunt destul de plictisitoare”, a spus Sarnak. „Doar numerele raționale sunt profunde.”

Iată un mod care este adevărat. Dacă desenați o linie dreaptă între două puncte raționale pe o curbă eliptică, locul în care acea linie intersectează din nou curba va fi de asemenea rațional. Puteți folosi acest fapt pentru a defini „adăugarea” într-o curbă eliptică, așa cum se arată mai jos.

Introducere

Desenați o linie între P și Q. Linia respectivă va intersecta curba într-un al treilea punct, R. (Matematicienii au un truc special pentru a trata cazul în care linia nu intersectează curba prin adăugarea unui „punct la infinit.”) Reflexia lui R peste x-axa este suma ta P + Q. Împreună cu această operație de adunare, toate soluțiile curbei formează un obiect matematic numit grup.

Matematicienii folosesc acest lucru pentru a defini „rangul” unei curbe. The rangul unei curbe se referă la numărul de soluţii raţionale pe care le are. Curbele de rang 0 au un număr finit de soluții. Curbele cu rang mai mare au un număr infinit de soluții a căror relație între ele folosind operația de adunare este descrisă de rang.

Rangurile nu sunt bine înțelese; matematicienii nu au întotdeauna o modalitate de a le calcula și nu știu cât de mari pot ajunge. (Cel mai mare rang exact cunoscut pentru o anumită curbă este 20.) Curbele similare pot avea ranguri complet diferite.

Curbele eliptice au, de asemenea, mult de-a face cu numerele prime, care sunt divizibile doar cu 1 și cu ele însele. În special, matematicienii se uită la curbele peste câmpuri finite - sisteme de aritmetică ciclică care sunt definite pentru fiecare număr prim. Un câmp finit este ca un ceas cu numărul de ore egal cu primul: dacă continui să numeri în sus, numerele încep din nou. În câmpul finit pentru 7, de exemplu, 5 plus 2 este egal cu zero și 5 plus 3 este egal cu 1.

Introducere

O curbă eliptică are asociată o succesiune de numere, numită ap, care se referă la numărul de soluții care există la curba în câmpul finit definit de primul p. Unul mai mic ap înseamnă mai multe soluții; un mai mare ap înseamnă mai puține soluții. Deși rangul este greu de calculat, succesiunea ap este mult mai usor.

Pe baza a numeroase calcule efectuate pe unul dintre primele computere, Birch și Swinnerton-Dyer au presupus o relație între rangul unei curbe eliptice și secvența ap. Oricine poate dovedi că are dreptate va câștiga un milion de dolari și nemurire matematică.

Apare un model surpriză

După începutul pandemiei, Yang-Hui He, cercetător la Institutul de Științe Matematice din Londra, a decis să accepte câteva noi provocări. Fusese licențiat în fizică la facultate și își luase doctoratul de la Institutul de Tehnologie din Massachusetts în fizică matematică. Dar era din ce în ce mai interesat de teoria numerelor și, având în vedere capacitățile tot mai mari ale inteligenței artificiale, s-a gândit că își va încerca să folosească AI ca instrument pentru a găsi modele neașteptate în numere. (Fusese deja folosind învățarea automată a clasifica Varietăți Calabi-Yau, structuri matematice care sunt utilizate pe scară largă în teoria corzilor.)

Introducere

În august 2020, pe măsură ce pandemia s-a adâncit, Universitatea din Nottingham l-a găzduit pentru un discuție online. Era pesimist cu privire la progresul său și cu privire la însăși posibilitatea de a folosi învățarea automată pentru a descoperi noi matematică. „Narațiunea lui a fost că teoria numerelor a fost grea pentru că nu puteai învăța lucruri de la mașină în teoria numerelor”, a spus Thomas Oliver, un matematician de la Universitatea Westminster care a fost în audiență. După cum își amintește El, „Nu am putut găsi nimic pentru că nu eram un expert. Nici măcar nu foloseam lucrurile potrivite pentru a vedea asta.”

Oliver și Kyu-Hwan Lee, un matematician la Universitatea din Connecticut, a început să lucreze cu He. „Am decis să facem asta doar pentru a învăța ce este învățarea automată, mai degrabă decât pentru a studia serios matematica”, a spus Oliver. „Dar am descoperit rapid că poți învăța automat o mulțime de lucruri.”

Oliver și Lee i-au sugerat să-și aplice tehnicile pentru a examina L-funcții, serii infinite strâns legate de curbele eliptice prin succesiune ap. Ei ar putea folosi o bază de date online de curbe eliptice și aferente acestora L-funcții numite LMFDB pentru a-și instrui clasificatorii de învățare automată. La acea vreme, baza de date avea puțin peste 3 milioane de curbe eliptice peste raționale. Până în octombrie 2020, au avut o hartie care a folosit informațiile culese din L-funcții pentru a prezice o anumită proprietate a curbelor eliptice. În noiembrie au împărtășit altă hârtie care a folosit învățarea automată pentru a clasifica alte obiecte în teoria numerelor. Până în decembrie, au putut prezice rândurile curbelor eliptice cu mare precizie.

Dar nu erau siguri de ce algoritmii lor de învățare automată funcționau atât de bine. Lee l-a rugat pe studentul său Alexey Pozdnyakov să vadă dacă poate înțelege ce se întâmplă. După cum se întâmplă, LMFDB sortează curbele eliptice în funcție de o cantitate numită conductor, care rezumă informații despre numerele prime pentru care o curbă nu se comportă bine. Așa că Pozdnyakov a încercat să se uite la un număr mare de curbe cu conductori similari simultan - să zicem, toate curbele cu conductori între 7,500 și 10,000.

Introducere

Aceasta s-a ridicat la aproximativ 10,000 de curbe în total. Aproximativ jumătate dintre aceștia aveau rangul 0 și jumătate rangul 1. (Rangurile mai înalte sunt extrem de rare.) Apoi a făcut media valorilor pentru ap pentru toate curbele de rang 0, mediate separat ap pentru toate curbele de rang 1 și a reprezentat grafic rezultatele. Cele două seturi de puncte au format două valuri distincte, ușor de perceptibil. Acesta a fost motivul pentru care clasificatorii de învățare automată au fost capabili să stabilească corect rangurile anumitor curbe.

„La început m-am simțit fericit că am terminat misiunea”, a spus Pozdnyakov. „Dar Kyu-Hwan a recunoscut imediat că acest model era surprinzător și atunci a devenit cu adevărat incitant.”

Lee și Oliver au fost captivați. „Alexey ne-a arătat poza și i-am spus că arată ca acel lucru pe care îl fac păsările”, a spus Oliver. „Și apoi Kyu-Hwan a căutat-o ​​și a spus că se numește murmurare, iar apoi Yang a spus că ar trebui să sunăm la ziar”Murmurații ale curbelor eliptice. '“

Ei și-au încărcat lucrarea în aprilie 2022 și au transmis-o unor alți matematicieni, așteptându-se nervoși să li se spună că așa-numita „descoperire” lor era bine cunoscută. Oliver a spus că relația era atât de vizibilă încât ar fi trebuit să fie observată cu mult timp în urmă.

Introducere

Aproape imediat, pretipărirea a strâns interes, în special din partea Andrew Sutherland, un cercetător de știință la MIT, care este unul dintre redactorii directori ai LMFDB. Sutherland și-a dat seama că 3 milioane de curbe eliptice nu erau suficiente pentru scopurile sale. Voia să se uite la distanțe de conducător mult mai mari pentru a vedea cât de robuste erau murmurațiile. El a extras date dintr-un alt depozit imens de aproximativ 150 de milioane de curbe eliptice. Încă nemulțumit, el a extras apoi date dintr-un alt depozit, cu 300 de milioane de curbe.

„Dar chiar și acestea nu au fost suficiente, așa că de fapt am calculat un nou set de date de peste un miliard de curbe eliptice și asta este ceea ce am folosit pentru a calcula imaginile cu adevărat de înaltă rezoluție”, a spus Sutherland. Murmurațiile au apărut dacă a avut o medie de peste 15,000 de curbe eliptice la un moment dat sau de un milion la un moment dat. Forma a rămas aceeași chiar și atunci când se uita la curbele peste numere prime din ce în ce mai mari, un fenomen numit invarianță la scară. Sutherland a realizat, de asemenea, că murmurațiile nu sunt unice pentru curbele eliptice, ci apar și în general L-functii. El a scris o scrisoare care rezumă constatările sale și l-a trimis la Sarnak și Michael Rubinstein la Universitatea din Waterloo.

„Dacă există o explicație cunoscută pentru aceasta, mă aștept să o știți”, a scris Sutherland.

Nu au făcut-o.

Explicarea modelului

Lee, He și Oliver au organizat un workshop despre murmurații în august 2023 la Institutul de Cercetare Computațională și Experimentală în Matematică (ICERM) al Universității Brown. Au venit Sarnak și Rubinstein, la fel ca și elevul lui Sarnak Nina Zubrilina.

Zubrilina și-a prezentat cercetările asupra tiparelor murmurației în forme modulare, funcții complexe speciale care, precum curbele eliptice, au asociate L-functii. În formele modulare cu conductoare mari, murmurațiile converg într-o curbă bine definită, mai degrabă decât să formeze un model perceptibil, dar dispersat. În o hartie postat pe 11 octombrie 2023, Zubrilina a dovedit că acest tip de murmurare urmează o formulă explicită pe care a descoperit-o.

„Marea realizare a Ninei este că ia dat o formulă pentru asta; O numesc formula densității murmurației Zubrilina”, a spus Sarnak. „Folosind matematică foarte sofisticată, ea a dovedit o formulă exactă care se potrivește perfect datelor.”

Formula ei este complicată, dar Sarnak o salută ca pe un nou tip important de funcție, comparabilă cu funcțiile Airy care definesc soluțiile ecuațiilor diferențiale utilizate într-o varietate de contexte din fizică, de la optică la mecanica cuantică.

Deși formula Zubrilinei a fost prima, au urmat altele. „În fiecare săptămână, apare o nouă lucrare”, a spus Sarnak, „folosind în principal instrumentele lui Zubrilina, explicând alte aspecte ale murmurațiilor”.

Jonathan Bober, Andrew Booker și Min Lee de la Universitatea din Bristol, împreună cu David Lowry-Duda al ICERM, a dovedit existenţa unui alt tip de murmuraţie în forme modulare în un alt ziar din octombrie. Și Kyu-Hwan Lee, Oliver și Pozdnyakov a dovedit existența de murmuraţii în obiecte numite personaje Dirichlet care sunt strâns legate de L-functii.

Sutherland a fost impresionat de doza semnificativă de noroc care a dus la descoperirea murmurațiilor. Dacă datele curbei eliptice nu ar fi fost comandate de către dirijor, murmurațiile ar fi dispărut. „Au fost norocoși să preia date de la LMFDB, care au venit pre-sortate în funcție de dirijor”, a spus el. „Este ceea ce leagă o curbă eliptică de forma modulară corespunzătoare, dar asta nu este deloc evident. … Două curbe ale căror ecuații arată foarte asemănătoare pot avea conductori foarte diferiți.” De exemplu, Sutherland a notat că y2 = x3 - 11x + 6 are conductorul 17, dar răsturnând semnul minus la un semn plus, y2 = x3 + 11x + 6 are conductor 100,736.

Chiar și atunci, murmurațiile au fost găsite doar din cauza lipsei de experiență a lui Pozdnyakov. „Nu cred că l-am fi găsit fără el”, a spus Oliver, „pentru că experții normalizează în mod tradițional ap să aibă valoarea absolută 1. Dar el nu le-a normalizat... așa că oscilațiile au fost foarte mari și vizibile.”

Modelele statistice pe care algoritmii AI le folosesc pentru a sorta curbele eliptice în funcție de rang există într-un spațiu de parametri cu sute de dimensiuni - prea multe pentru ca oamenii să le poată sorta în minte, ca să nu mai vorbim de vizualizare, a remarcat Oliver. Dar, deși învățarea automată a găsit oscilațiile ascunse, „abia mai târziu am înțeles că acestea sunt murmurații”.

Nota editorului: Andrew Sutherland, Kyu-Hwan Lee și baza de date L-functions and modular forms (LMFDB) au primit toate finanțare de la Simons Foundation, care finanțează și această publicație independentă din punct de vedere editorial. Deciziile de finanțare ale Fundației Simons nu au nicio influență asupra acoperirii noastre. Mai multe informații sunt disponibile aici.

Timestamp-ul:

Mai mult de la Quantamagazina