Matematycy łamią prostą, ale upartą klasę równań PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Matematycy rozwiązują prostą, ale upartą klasę równań

W III wieku p.n.e. Archimedes stwarzane zagadkę dotyczącą hodowli bydła, którą, jak twierdził, może rozwiązać tylko prawdziwie mądra osoba. Jego problem ostatecznie sprowadzał się do równania, które obejmuje różnicę między dwoma wyrazami do kwadratu, które można zapisać jako x2 - dy2 = 1. Tutaj d jest liczbą całkowitą — dodatnią lub ujemną liczbą obliczeniową — a Archimedes szukał rozwiązań, w których oba x i y są również liczbami całkowitymi.

Ta klasa równań, zwana równaniami Pella, od tysiącleci fascynuje matematyków.

Kilka wieków po Archimedesie, indyjski matematyk Brahmagupta, a później matematyk Bhaskara II, dostarczyli algorytmy do znajdowania całkowitych rozwiązań tych równań. W połowie XVI wieku francuski matematyk Pierre de Fermat (który nie wiedział o tej pracy) odkrył to na nowo w niektórych przypadkach, nawet gdy d przypisano stosunkowo małą wartość, najmniejsze możliwe rozwiązania liczb całkowitych dla x i y może być ogromny. Kiedy wysłał szereg problemów z wyzwaniami do rywalizujących matematyków, zawierały one równanie x2 - 61y2 = 1, którego najmniejsze rozwiązania mają dziewięć lub 10 cyfr. (Jeśli chodzi o Archimedesa, jego zagadka zasadniczo dotyczyła całkowitoliczbowych rozwiązań równania x2 - 4,729,494y2 = 1. „Aby wydrukować najmniejsze rozwiązanie, potrzeba 50 stron”, powiedział Piotra Koymansa, matematyk na Uniwersytecie Michigan. „W pewnym sensie jest to gigantyczny troll autorstwa Archimedesa”.)

Ale rozwiązania równań Pella mogą zdziałać znacznie więcej. Załóżmy na przykład, że chcesz przybliżyć $lateks sqrt{2}$, liczbę niewymierną, jako stosunek liczb całkowitych. Okazuje się, że rozwiązanie równania Pella x2 - 2y2 = 1 może ci w tym pomóc: $lateks sqrt{2}$ (lub ogólniej $latex sqrt{d}$) można dobrze przybliżyć, przepisując rozwiązanie jako ułamek formularza x/y.

Może nawet bardziej intrygujące, rozwiązania te mówią też coś o poszczególnych systemach liczbowych, które matematycy nazywają dzwonkami. W takim systemie liczbowym matematycy mogą dołączyć $latex sqrt{2}$ do liczb całkowitych. Pierścienie mają pewne właściwości i matematycy chcą je zrozumieć. Okazuje się, że równanie Pella może im w tym pomóc.

I tak „wielu bardzo znanych matematyków – prawie każdy matematyk w pewnym okresie czasu – faktycznie studiowało to równanie ze względu na to, jak proste jest” – powiedział. Mark Szusterman, matematyk na Uniwersytecie Harvarda. Do matematyków tych należeli Fermat, Euler, Lagrange i Dirichlet. (John Pell, nie tak bardzo; równanie zostało błędnie nazwane jego imieniem.)

Teraz Koymans i Karola Pagano, matematyk z Concordia University w Montrealu, okazało się przypuszczeniem sprzed dziesięcioleci związane z równaniem Pella, które określa ilościowo, jak często dana forma równania ma rozwiązania całkowite. W tym celu zaimportowali idee z innej dziedziny — teorii grup — jednocześnie lepiej rozumiejąc kluczowy, ale tajemniczy przedmiot badań w tej dziedzinie. „Użyli naprawdę głębokich i pięknych pomysłów” – powiedział Andrzej Granville, matematyk na Uniwersytecie w Montrealu. „Naprawdę to przybili”.

Zepsuta arytmetyka

We wczesnych 1990-ach, Piotra Stevenhagena, matematyk z Leiden University w Holandii, zainspirował się niektórymi powiązaniami między równaniami Pella a teorią grup, aby wysnuć przypuszczenie, jak często te równania mają rozwiązania całkowite. Ale „Nie spodziewałem się, że zostanie to udowodnione w najbliższym czasie”, powiedział – a nawet za jego życia. Dostępne techniki nie wydawały się wystarczająco silne, aby zaatakować problem.

Jego przypuszczenie zależy od szczególnej cechy pierścieni. W kręgu liczb, gdzie na przykład $lateks sqrt{-5}$ został dodany do liczb całkowitych (matematycy często pracują z liczbami „urojonymi”, takimi jak $latex sqrt{-5}$), istnieją dwa różne sposoby podziel liczbę na jej czynniki pierwsze. Na przykład liczba 6 może być zapisana nie tylko jako 2 × 3, ale również jako (1 + $latex sqrt{-5}$) × (1 – $latex sqrt{-5}$). W rezultacie w tym pierścieniu załamuje się unikalna faktoryzacja liczb pierwszych — centralna zasada arytmetyki, uznawana praktycznie za pewnik w normalnych liczbach całkowitych. Zakres, w jakim to się dzieje, jest zakodowany w obiekcie skojarzonym z tym pierścieniem, zwanym grupą klas.

Jednym ze sposobów, w jaki matematycy próbują uzyskać głębszy wgląd w interesujący ich system liczbowy — na przykład $latex sqrt{2}$ w połączeniu z liczbami całkowitymi — jest obliczenie i zbadanie grupy klasowej. Jednak prawie niemożliwie trudno jest określić ogólne zasady zachowania grup klasowych we wszystkich tych różnych systemach liczbowych.

W latach 1980. matematycy Henryk Cohen i Henryk Lenstra przedstawił szeroki zestaw przypuszczeń na temat tego, jak te zasady powinny wyglądać. Te „heurystyki Cohena-Lenstry” mogą wiele powiedzieć o grupach klasowych, które z kolei powinny ujawnić właściwości ich podstawowych systemów liczbowych.

Był tylko jeden problem. Chociaż wiele obliczeń wydaje się wspierać heurystykę Cohena-Lenstry, nadal są one przypuszczeniami, a nie dowodami. „Jeśli chodzi o twierdzenia, do niedawna prawie nic nie wiedzieliśmy” – powiedział Aleks Bartel, matematyk na Uniwersytecie w Glasgow.

Co ciekawe, typowe zachowanie grupy klasowej jest nierozerwalnie związane z zachowaniem równań Pella. Zrozumienie jednego problemu pomaga zrozumieć drugi – do tego stopnia, że ​​przypuszczenie Stevenhagena „było również problemem testowym dla postępów poczynionych w heurystyce Cohena-Lenstry” – powiedział Pagano.

Nowa praca dotyczy ujemnego równania Pella, gdzie x2 - dy2 ma wartość -1 zamiast 1. W przeciwieństwie do oryginalnego równania Pella, które zawsze ma nieskończoną liczbę rozwiązań liczb całkowitych dla dowolnego d, nie wszystkie wartości d w ujemnym równaniu Pella dają równanie, które można rozwiązać. Brać x2 - 3y2 = −1: Bez względu na to, jak daleko na osi liczbowej spojrzysz, nigdy nie znajdziesz rozwiązania, chociaż x2 - 3y2 = 1 ma nieskończenie wiele rozwiązań.

W rzeczywistości istnieje wiele wartości d dla których nie można rozwiązać ujemnego równania Pella: W oparciu o znane zasady dotyczące wzajemnego powiązania pewnych liczb, d nie może być wielokrotnością 3, 7, 11, 15 itd.

Ale nawet jeśli unikasz tych wartości d i rozważmy tylko pozostałe ujemne równania Pella, nadal nie zawsze można znaleźć rozwiązania. W tym mniejszym zbiorze możliwych wartości d, jaka proporcja faktycznie działa?

W 1993 roku Stevenhagen zaproponował formułę, która dawała precyzyjną odpowiedź na to pytanie. Z wartości dla d które mogą działać (to znaczy wartości, które nie są wielokrotnościami 3, 7 itd.), przewidział, że około 58% spowoduje powstanie ujemnych równań Pella z rozwiązaniami całkowitymi.

Przypuszczenie Stevenhagena było motywowane w szczególności powiązaniem między ujemnym równaniem Pella a heurystyką Cohena-Lenstry na grupach klasowych – powiązaniem, które wykorzystali Koymans i Pagano, gdy 30 lat później w końcu udowodnili, że ma rację.

Lepsza armata

W 2010 roku Koymans i Pagano byli jeszcze studentami studiów licencjackich — nie znającymi jeszcze hipotezy Stevenhagena — kiedy ukazał się artykuł, który poczynił jedne z pierwszych postępów w tym problemie od lat.

W tej pracy, która była opublikowane w Roczniki matematykimatematycy Étienne Fouvry i Jürgena Klünersa wykazali, że proporcja wartości d to działałoby, gdyby ujemne równanie Pella mieściło się w pewnym zakresie. Aby to zrobić, zapoznali się z zachowaniem niektórych elementów odpowiednich grup klasowych. Ale potrzebowaliby zrozumienia wielu innych elementów, aby znaleźć o wiele bardziej precyzyjne szacunki Stevenhagena wynoszące 58%. Niestety, te elementy pozostały nieodgadnione: wciąż potrzebne były nowatorskie metody, aby nadać sens ich strukturze. Dalszy postęp wydawał się niemożliwy.

Następnie, w 2017 roku, kiedy Koymans i Pagano studiowali razem na uniwersytecie w Leiden, pojawił się papier to wszystko zmieniło. „Kiedy to zobaczyłem, od razu zrozumiałem, że to bardzo, bardzo imponujący wynik” – powiedział Koymans. „To było jak, OK, teraz mam armatę, z której mogę strzelać do tego problemu i mam nadzieję, że mogę zrobić postęp”. (W tym czasie Stevenhagen i Lenstra byli również profesorami w Leiden, co pomogło rozbudzić zainteresowanie Koymansa i Pagano tym problemem.)

Artykuł był autorstwa absolwenta Harvardu, Alexander Smith (który jest teraz gliną w Stanford). Koymans i Pagano nie byli jedynymi, którzy okrzyknęli tę pracę przełomową. „Pomysły były niesamowite” — powiedział Granville. "Rewolucyjny."

Smith próbował zrozumieć własności rozwiązań równań zwanych krzywymi eliptycznymi. W ten sposób opracował określoną część heurystyki Cohena-Lenstry. Był to nie tylko pierwszy poważny krok w ugruntowaniu tych szerszych przypuszczeń jako faktów matematycznych, ale dotyczył dokładnie tej części grupy klasowej, którą Koymans i Pagano musieli zrozumieć w swojej pracy nad przypuszczeniem Stevenhagena. (Ten utwór zawierał elementy, które Fouvry i Klüners badali w ich częściowym wyniku, ale również wykraczał daleko poza nie.)

Jednak Koymans i Pagano nie mogli od razu zastosować metod Smitha. (Gdyby to było możliwe, prawdopodobnie zrobiłby to sam Smith). Dowód Smitha dotyczył grup klas powiązanych z odpowiednimi pierścieniami liczbowymi (takich, w których $latex sqrt{d}$ jest przyłączone do liczb całkowitych) — ale rozważył wszystkie wartości całkowite d. Z drugiej strony Koymans i Pagano myśleli tylko o malutkim podzbiorze tych wartości d. W rezultacie musieli ocenić przeciętne zachowanie wśród znacznie mniejszej części grup klasowych.

Te grupy klasowe zasadniczo stanowiły 0% grup klasowych Smitha — co oznacza, że ​​Smith mógł je wyrzucić, gdy pisał swój dowód. W ogóle nie przyczyniły się do przeciętnego zachowania, którego się uczył.

A kiedy Koymans i Pagano próbowali zastosować swoje techniki tylko w tych grupach klasowych, na których im zależało, metody natychmiast się załamały. Para musiałaby wprowadzić znaczące zmiany, aby działały. Co więcej, nie charakteryzowali tylko jednej grupy klasowej, ale raczej rozbieżności, które mogą istnieć między dwiema różnymi grupami klasowymi (byłoby to główną częścią ich dowodu na przypuszczenie Stevenhagena) – co również wymagałoby różnych narzędzi.

Tak więc Koymans i Pagano zaczęli uważniej przeszukiwać gazetę Smitha w nadziei, że dokładnie określą, gdzie sprawy zaczęły toczyć się z toru. Była to trudna, żmudna praca, nie tylko dlatego, że materiał był tak skomplikowany, ale dlatego, że Smith w tym czasie jeszcze dopracowywał swój preprint, wprowadzając niezbędne poprawki i doprecyzowania. (Opublikował nowa wersja jego pracy online w zeszłym miesiącu.)

Przez cały rok Koymans i Pagano uczyli się razem dowodu, linijka po linijce. Spotykali się codziennie, omawiając daną sekcję podczas lunchu, zanim spędzili kilka godzin przy tablicy, pomagając sobie nawzajem w przepracowaniu odpowiednich pomysłów. Jeśli jeden z nich poczynił postępy na własną rękę, wysłał do drugiego SMS-a, aby go zaktualizować. Shusterman wspomina, że ​​czasami widział ich pracujących do późna w nocy. Pomimo (a może właśnie z powodu) wyzwań, jakie się z tym wiązało, „to było bardzo fajnie robić razem”, powiedział Koymans.

W końcu zidentyfikowali, gdzie powinni spróbować nowego podejścia. Początkowo byli w stanie dokonać jedynie skromnych ulepszeń. Razem z matematykami Stefania Chan i Djordjo Milović, wymyślili, jak poradzić sobie z dodatkowymi elementami w grupie klasowej, co pozwoliło im uzyskać lepsze umiejętności niż Fouvry i Klüners. Jednak wciąż umykały im znaczące fragmenty struktury grupy klasowej.

Jednym z głównych problemów, z jakimi musieli się zmierzyć – czymś, dla czego metoda Smitha nie sprawdzała się już w tym nowym kontekście – było upewnienie się, że naprawdę analizują „przeciętne” zachowanie grup klasowych jako wartości d stawał się coraz większy i większy. Aby ustalić odpowiedni stopień losowości, Koymans i Pagano dowiedli skomplikowanego zestawu reguł, zwanych prawami wzajemności. W końcu pozwoliło im to uzyskać kontrolę, jakiej potrzebowali, nad różnicą między dwiema grupami klasowymi.

Ten postęp, w połączeniu z innymi, pozwolił im w tym roku ostatecznie potwierdzić przypuszczenie Stevenhagena. „To niesamowite, że udało im się to całkowicie rozwiązać” — powiedział Chan. „Wcześniej mieliśmy wszystkie te problemy”.

To, co zrobili, „zaskoczyło mnie”, powiedział Smith. „Koymans i Pagano w pewnym sensie zachowali mój stary język i po prostu używali go, by pchać dalej i dalej w kierunku, którego ledwo rozumiem”.

Najostrzejsze narzędzie

Od czasu, gdy przedstawił ją pięć lat temu, dowód Smitha dotyczący jednej części heurystyki Cohena-Lenstry był postrzegany jako sposób na otwarcie drzwi dla wielu innych problemów, w tym pytań o krzywe eliptyczne i inne interesujące struktury. (W swoim artykule Koymans i Pagano wymieniają około tuzina przypuszczeń, w odniesieniu do których mają nadzieję wykorzystać swoje metody. Wiele z nich nie ma nic wspólnego z ujemnym równaniem Pella ani nawet z grupami klasowymi.)

„Wiele obiektów ma struktury, które nie różnią się od tego rodzaju grup algebraicznych” – powiedział Granville. Ale wiele z tych samych przeszkód, z którymi musieli zmierzyć się Koymans i Pagano, występuje również w tych innych kontekstach. Nowa praca nad ujemnym równaniem Pella pomogła usunąć te przeszkody. „Alexander Smith powiedział nam, jak zbudować te piły i młotki, ale teraz musimy sprawić, by były tak ostre, jak to możliwe i tak mocne, jak to tylko możliwe, i jak najlepiej dostosować się do różnych sytuacji” – powiedział Bartel. „Jedną z rzeczy, które robi ten artykuł, jest bardzo duży krok w tym kierunku”.

Cała ta praca w międzyczasie poprawiła zrozumienie matematyków tylko na temat jednego aspektu grup klasowych. Reszta przypuszczeń Cohena-Lenstry pozostaje poza zasięgiem, przynajmniej na razie. Ale artykuł Koymansa i Pagano „wskazuje, że techniki, które mamy do rozwiązywania problemów w Cohen-Lenstra, w pewnym sensie dorastają”, powiedział Smith.

Sam Lenstra był podobnie optymistyczny. Jest „absolutnie spektakularny”, napisał w e-mailu. „To naprawdę otwiera nowy rozdział w gałęzi teorii liczb, która jest tak stara jak sama teoria liczb”.

Znak czasu:

Więcej z Magazyn ilościowy