Matematiker knäcker en enkel men envis ekvationsklass PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Matematiker knäcker en enkel men envis ekvationsklass

Under det tredje århundradet f.Kr., Arkimedes pose en gåta om vallning av boskap som, hävdade han, bara en verkligt vis person kunde lösa. Hans problem kokade slutligen ner till en ekvation som involverar skillnaden mellan två kvadratiska termer, som kan skrivas som x2 - dy2 = 1. Här, d är ett heltal — ett positivt eller negativt räknetal — och Arkimedes letade efter lösningar där båda x och y är också heltal.

Denna ekvationsklass, kallad Pell-ekvationerna, har fascinerat matematiker under årtusenden sedan dess.

Några århundraden efter Arkimedes tillhandahöll den indiske matematikern Brahmagupta och senare matematikern Bhāskara II algoritmer för att hitta heltalslösningar till dessa ekvationer. I mitten av 1600-talet återupptäckte den franske matematikern Pierre de Fermat (som inte var medveten om det arbetet) att i vissa fall, även när d tilldelades ett relativt litet värde, minsta möjliga heltalslösningar för x och y kan vara massiv. När han skickade en rad utmaningsproblem till rivaliserande matematiker, inkluderade de ekvationen x2 - 61y2 = 1, vars minsta lösningar har nio eller 10 siffror. (När det gäller Arkimedes, bad hans gåta i huvudsak om heltalslösningar till ekvationen x2 - 4,729,494y2 = 1. "För att skriva ut den minsta lösningen tar det 50 sidor," sa Peter Koymans, en matematiker vid University of Michigan. "I någon mening är det ett gigantiskt troll av Arkimedes.")

Men lösningarna på Pell-ekvationerna kan göra mycket mer. Säg till exempel att du vill approximera $latex sqrt{2}$, ett irrationellt tal, som ett förhållande mellan heltal. Det visar sig att lösa Pell-ekvationen x2 - 2y2 = 1 kan hjälpa dig att göra det: $latex sqrt{2}$ (eller, mer allmänt, $latex sqrt{d}$) kan uppskattas väl genom att skriva om lösningen som en bråkdel av formuläret x/y.

Kanske ännu mer spännande, dessa lösningar säger dig också något om vissa nummersystem, som matematiker kallar ringar. I ett sådant talsystem kan matematiker ansluta $latex sqrt{2}$ till heltalen. Ringar har vissa egenskaper, och matematiker vill förstå dessa egenskaper. Pell-ekvationen, visar det sig, kan hjälpa dem att göra det.

Och så "många mycket kända matematiker - nästan alla matematiker under en viss tidsperiod - studerade faktiskt den här ekvationen på grund av hur enkel den är," sa Mark Shusterman, en matematiker vid Harvard University. Dessa matematiker inkluderade Fermat, Euler, Lagrange och Dirichlet. (John Pell, inte så mycket, ekvationen var av misstag uppkallad efter honom.)

Nu Koymans och Carlo Pagano, en matematiker vid Concordia University i Montreal, har bevisade en årtionden gammal gissning relaterad till Pell-ekvationen, en som kvantifierar hur ofta en viss form av ekvationen har heltalslösningar. För att göra det importerade de idéer från ett annat fält - gruppteori - samtidigt som de fick en bättre förståelse för ett centralt men mystiskt studieobjekt inom det fältet. "De använde riktigt djupa och vackra idéer," sa Andrew Granville, en matematiker vid University of Montreal. "De lyckades verkligen."

Bruten aritmetik

I de tidiga 1990- Peter Stevenhagen, en matematiker vid Leiden University i Nederländerna, inspirerades av några av kopplingarna han såg mellan Pell-ekvationerna och gruppteorin för att göra en gissning om hur ofta dessa ekvationer har heltalslösningar. Men "Jag förväntade mig inte att det skulle bevisas någon gång snart," sa han - eller ens under hans livstid. Tillgängliga tekniker verkade inte tillräckligt starka för att attackera problemet.

Hans förmodan beror på en speciell egenskap hos ringar. I ringen av tal där till exempel $latex sqrt{-5}$ har lagts till heltal (matematiker arbetar ofta med "imaginära" tal som $latex sqrt{-5}$), finns det två distinkta sätt att dela upp ett tal i dess primtalsfaktorer. Siffran 6, till exempel, kan skrivas inte bara som 2 × 3, utan också som (1 + $latex sqrt{-5}$) × (1 – $latex sqrt{-5}$). Som ett resultat, i denna ring, bryts unik primtalsfaktorisering - en central grundsats i aritmetiken, en som praktiskt taget tas för given i de normala heltal -. I vilken utsträckning detta inträffar är kodat i ett objekt som är associerat med den ringen, som kallas en klassgrupp.

Ett sätt som matematiker försöker få djupare insikter i ett talsystem de är intresserade av – säg $latex sqrt{2}$ som gränsar till heltalen – är att beräkna och studera dess klassgrupp. Ändå är det nästan oöverkomligt svårt att slå fast allmänna regler för hur klassgrupper beter sig i alla dessa olika talsystem.

På 1980-talet, matematikerna Henri Cohen och Hendrik Lenstra lägga fram en bred uppsättning gissningar om hur dessa regler ska se ut. Dessa "Cohen-Lenstra-heuristiker" skulle kunna berätta mycket om klassgrupper, som i sin tur borde avslöja egenskaper hos deras underliggande talsystem.

Det var bara ett problem. Även om många beräkningar verkar stödja Cohen-Lenstras heuristik, är de fortfarande gissningar, inte bevis. "När det gäller satser visste vi tills helt nyligen nästan ingenting," sa Alex Bartel, en matematiker vid University of Glasgow.

Spännande nog är en klassgrupps typiska beteende oupplösligt sammanflätat med beteendet hos Pell-ekvationer. Att förstå ett problem hjälper till att förstå det andra - så mycket att Stevenhagens gissning "också har varit ett testproblem för vilka framsteg som än har gjorts på Cohen-Lenstras heuristik", sa Pagano.

Det nya arbetet involverar den negativa Pell-ekvationen, där x2 - dy2 sätts till lika med −1 istället för 1. Till skillnad från den ursprungliga Pell-ekvationen, som alltid har ett oändligt antal heltalslösningar för alla d, inte alla värden av d i den negativa Pell-ekvationen ge en ekvation som kan lösas. Ta x2 - 3y2 = −1: Oavsett hur långt längs tallinjen du tittar, kommer du aldrig att hitta en lösning, trots att x2 - 3y2 = 1 har oändligt många lösningar.

Faktum är att det finns många värderingar av d för vilken den negativa Pell-ekvationen inte kan lösas: Baserat på kända regler om hur vissa tal relaterar till varandra, d kan inte vara en multipel av 3, 7, 11, 15 och så vidare.

Men även när du undviker de värderingarna av d och betrakta bara de återstående negativa Pell-ekvationerna, det är fortfarande inte alltid möjligt att hitta lösningar. I den mindre uppsättningen av möjliga värden på d, vilken andel fungerar egentligen?

1993 föreslog Stevenhagen en formel som gav ett exakt svar på den frågan. Av värdena för d som kan fungera (det vill säga värden som inte är multiplar av 3, 7, etc.), förutspådde han att ungefär 58 % skulle ge upphov till negativa Pell-ekvationer med heltalslösningar.

Stevenhagens gissning motiverades särskilt av kopplingen mellan den negativa Pell-ekvationen och Cohen-Lenstra-heuristiken på klassgrupper - en koppling som Koymans och Pagano utnyttjade när de 30 år senare äntligen bevisade att han hade rätt.

En bättre kanon

2010 var Koymans och Pagano fortfarande studenter - ännu inte bekanta med Stevenhagens gissningar - när ett papper kom ut som gjorde några av de första framstegen på problemet på flera år.

I det arbetet, som var offentliggjordes i Annaler för matematik, matematikerna Étienne Fouvry och Jürgen Klüners visade att andelen värden på d som skulle fungera för den negativa Pell-ekvationen föll inom ett visst intervall. För att göra det fick de koll på beteendet hos vissa delar av de relevanta klassgrupperna. Men de skulle behöva en förståelse för många fler element för att komma in på Stevenhagens mycket mer exakta uppskattning på 58%. Tyvärr förblev dessa element outgrundliga: Nya metoder behövdes fortfarande för att förstå deras struktur. Ytterligare framsteg verkade omöjliga.

Sedan, 2017, när Koymans och Pagano båda gick i forskarskola tillsammans vid Leiden University, ett papper dök upp som förändrade allt. "När jag såg det här insåg jag direkt att det var ett väldigt, väldigt imponerande resultat," sa Koymans. "Det var som, OK, nu har jag en kanon som jag kan skjuta på det här problemet och hoppas att jag kan göra framsteg." (På den tiden var Stevenhagen och Lenstra också professorer i Leiden, vilket hjälpte till att väcka Koymans och Paganos intresse för problemet.)

Tidningen var av en doktorand vid Harvard, Alexander Smith (som nu är Clay-stipendiat på Stanford). Koymans och Pagano var inte ensamma om att hylla arbetet som ett genombrott. "Idéerna var fantastiska," sa Granville. "Revolutionerande."

Smith hade försökt förstå egenskaperna hos lösningar till ekvationer som kallas elliptiska kurvor. Därmed arbetade han fram en specifik del av Cohen-Lenstras heuristik. Det var inte bara det första stora steget i att cementera dessa bredare gissningar som matematiska fakta, utan det involverade just den del av klassgruppen som Koymans och Pagano behövde förstå i sitt arbete med Stevenhagens gissningar. (Detta stycke inkluderade de element som Fouvry och Klüners hade studerat i sitt delresultat, men det gick också långt utöver dem.)

Koymans och Pagano kunde dock inte helt enkelt använda Smiths metoder direkt. (Om det hade varit möjligt, skulle Smith själv förmodligen ha gjort det.) Smiths bevis handlade om klassgrupper som var associerade med rätt talringar (de där $latex sqrt{d}$ sammanfogas med heltalen) — men han ansåg alla heltalsvärden av d. Koymans och Pagano, å andra sidan, tänkte bara på en liten delmängd av dessa värden av d. Som ett resultat behövde de bedöma det genomsnittliga beteendet bland en mycket mindre del av klassgrupperna.

Dessa klassgrupper utgjorde i huvudsak 0% av Smiths klassgrupper - vilket innebär att Smith kunde kasta bort dem när han skrev sitt bevis. De bidrog inte alls till det genomsnittliga beteende som han studerade.

Och när Koymans och Pagano försökte tillämpa hans tekniker på just de klassgrupper de brydde sig om, bröt metoderna ner omedelbart. Paret skulle behöva göra betydande förändringar för att få dem att fungera. Dessutom karakteriserade de inte bara en klassgrupp, utan snarare den diskrepans som kan finnas mellan två olika klassgrupper (att göra det skulle vara en stor del av deras bevis på Stevenhagens gissningar) - vilket också skulle kräva några olika verktyg.

Så Koymans och Pagano började gå igenom Smiths papper mer noggrant i hopp om att få reda på exakt var saker och ting började gå av stapeln. Det var svårt och mödosamt arbete, inte bara för att materialet var så komplicerat, utan för att Smith fortfarande finslipade sitt förtryck vid den tiden och gjorde nödvändiga korrigeringar och förtydliganden. (Han postade ny version av hans tidning online förra månaden.)

Under ett helt år lärde sig Koymans och Pagano beviset tillsammans, rad för rad. De träffades varje dag och diskuterade ett visst avsnitt under lunchen innan de tillbringade några timmar vid en svart tavla och hjälpte varandra att arbeta igenom relevanta idéer. Om en av dem gjorde framsteg på egen hand, smsade han den andra för att uppdatera honom. Shusterman minns att han ibland såg dem arbeta långt in på natten. Trots (eller kanske på grund av) utmaningarna det innebar, "var det väldigt roligt att göra tillsammans", sa Koymans.

De identifierade till slut var de skulle behöva prova ett nytt tillvägagångssätt. Till en början kunde de bara göra blygsamma förbättringar. Tillsammans med matematikerna Stephanie Chan och Djordjo Milovic, de kom på hur de skulle få grepp om några ytterligare element i klassgruppen, vilket gjorde att de kunde få bättre gränser än vad Fouvry och Klüners hade. Men betydande delar av klassgruppens struktur gäckade dem fortfarande.

Ett stort problem som de var tvungna att ta itu med – något som Smiths metod inte längre fungerade för i detta nya sammanhang – var att se till att de verkligen analyserade "genomsnittligt" beteende för klassgrupper som värderingarna av d blev större och större. För att fastställa den rätta graden av slumpmässighet visade Koymans och Pagano en komplicerad uppsättning regler, kallade ömsesidighetslagar. I slutändan tillät det dem att få den kontroll de behövde över skillnaden mellan de två klassgrupperna.

Detta framsteg, tillsammans med andra, gjorde att de äntligen kunde slutföra beviset på Stevenhagens gissningar tidigare i år. "Det är fantastiskt att de kunde lösa det helt", sa Chan. "Tidigare hade vi alla dessa problem."

Vad de gjorde "överraskade mig", sa Smith. "Koymans och Pagano har liksom behållit mitt gamla språk och bara använt det för att driva längre och längre i en riktning som jag knappt förstår längre."

Det skarpaste verktyget

Sedan han introducerade det för fem år sedan sågs Smiths bevis på en del av Cohen-Lenstra-heuristiken som ett sätt att öppna dörrar till en mängd andra problem, inklusive frågor om elliptiska kurvor och andra strukturer av intresse. (I sin tidning listar Koymans och Pagano ett dussintal gissningar som de hoppas kunna använda sina metoder på. Många har ingenting att göra med den negativa Pell-ekvationen eller ens klassgrupper.)

"Många objekt har strukturer som inte skiljer sig från dessa typer av algebraiska grupper," sa Granville. Men många av samma vägspärrar som Koymans och Pagano fick möta finns också i dessa andra sammanhang. Det nya arbetet med den negativa Pell-ekvationen har hjälpt till att demontera dessa vägspärrar. "Alexander Smith har berättat för oss hur man bygger dessa sågar och hammare, men nu måste vi göra dem så vassa som möjligt och så hårt slagande som möjligt och så anpassningsbara som möjligt till olika situationer," sa Bartel. "En av de saker som denna tidning gör är att gå en hel del i den riktningen."

Allt detta arbete har under tiden förfinat matematikernas förståelse av bara en aspekt av klassgrupper. Resten av Cohen-Lenstras gissningar förblir utom räckhåll, åtminstone för tillfället. Men Koymans och Paganos papper "är en indikation på att teknikerna vi har för att angripa problem i Cohen-Lenstra växer upp", sa Smith.

Lenstra själv var lika optimistisk. Det är "absolut spektakulärt", skrev han i ett mejl. "Det öppnar verkligen upp ett nytt kapitel i en gren av talteorin som är lika gammal som talteorin själv."

Tidsstämpel:

Mer från Quantamagazin