'Murmurações' de curva elíptica encontradas com IA decolando | Revista Quanta

'Murmurações' de curva elíptica encontradas com IA decolando | Revista Quanta

'Murmurações' de curva elíptica encontradas com IA decolando | Revista Quanta PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Introdução

As curvas elípticas estão entre os objetos mais atraentes da matemática moderna. Eles não parecem complicados, mas formam uma via expressa entre a matemática que muitas pessoas aprendem no ensino médio e a pesquisa matemática em sua forma mais obscura. Eles foram fundamentais para a célebre prova do Último Teorema de Fermat feita por Andrew Wiles na década de 1990. Eles são ferramentas essenciais na criptografia moderna. E em 2000, o Clay Mathematics Institute nomeou um conjectura sobre as estatísticas de curvas elípticas, um dos sete “Problemas do Prêmio do Milênio”, cada um dos quais traz um prêmio de US$ 1 milhão pela sua solução. Essa conjectura, aventurada pela primeira vez por Bryan Birch e Peter Swinnerton-Dyer na década de 1960, ainda não foi provado.

Compreender as curvas elípticas é um empreendimento de alto risco que tem sido fundamental para a matemática. Assim, em 2022, quando uma colaboração transatlântica utilizou técnicas estatísticas e inteligência artificial para descobrir padrões completamente inesperados em curvas elípticas, foi uma contribuição bem-vinda, embora inesperada. “Era apenas uma questão de tempo até que o aprendizado de máquina chegasse à nossa porta com algo interessante”, disse Pedro Sarnak, matemático do Instituto de Estudos Avançados e da Universidade de Princeton. Inicialmente, ninguém conseguiu explicar por que existem os padrões recém-descobertos. Desde então, numa série de artigos recentes, os matemáticos começaram a desvendar as razões por detrás dos padrões, apelidados de “murmúrios” pela sua semelhança com as formas fluidas dos estorninhos em bando, e começaram a provar que devem ocorrer não apenas no particular exemplos examinados em 2022, mas em curvas elípticas de forma mais geral.

A importância de ser elíptico

Para entender o que são esses padrões, temos que estabelecer algumas bases sobre o que são curvas elípticas e como os matemáticos as categorizam.

Uma curva elíptica relaciona o quadrado de uma variável, comumente escrita como y, elevado à terceira potência de outro, comumente escrito como x: y2 = x3 + Ax + B, para algum par de números A e B, Contanto A e B atender a algumas condições simples. Esta equação define uma curva que pode ser representada graficamente no plano, conforme mostrado abaixo. (Apesar da semelhança nos nomes, uma elipse não é uma curva elíptica.)

Introdução

Embora pareçam simples, as curvas elípticas revelam-se ferramentas incrivelmente poderosas para os teóricos dos números – matemáticos que procuram padrões nos números inteiros. Em vez de deixar as variáveis x e y abrangendo todos os números, os matemáticos gostam de restringi-los a diferentes sistemas numéricos, que eles chamam de definição de uma curva “sobre” um determinado sistema numérico. Curvas elípticas restritas aos números racionais — números que podem ser escritos como frações — são particularmente úteis. “Curvas elípticas sobre números reais ou complexos são bastante enfadonhas”, disse Sarnak. “Só os números racionais são profundos.”

Aqui está uma maneira que é verdade. Se você traçar uma linha reta entre dois pontos racionais em uma curva elíptica, o local onde essa linha cruza novamente a curva também será racional. Você pode usar esse fato para definir “adição” em uma curva elíptica, conforme mostrado abaixo.

Introdução

Desenhe uma linha entre P e Q. Essa linha cruzará a curva em um terceiro ponto, R. (Os matemáticos têm um truque especial para lidar com o caso em que a reta não intercepta a curva adicionando um “ponto no infinito”.) O reflexo de R através de x-axis é a sua soma P + Q. Juntamente com esta operação de adição, todas as soluções da curva formam um objeto matemático denominado grupo.

Os matemáticos usam isso para definir a “classificação” de uma curva. O classificação de uma curva está relacionado ao número de soluções racionais que possui. As curvas de classificação 0 têm um número finito de soluções. Curvas com classificação mais alta têm um número infinito de soluções cuja relação entre si usando a operação de adição é descrita pela classificação.

As classificações não são bem compreendidas; os matemáticos nem sempre têm como computá-los e não sabem até que ponto podem atingir. (A maior classificação exata conhecida para uma curva específica é 20.) Curvas de aparência semelhante podem ter classificações completamente diferentes.

As curvas elípticas também têm muito a ver com números primos, que só são divisíveis por 1 e por eles próprios. Em particular, os matemáticos analisam curvas sobre corpos finitos – sistemas de aritmética cíclica definidos para cada número primo. Um corpo finito é como um relógio com o número de horas igual ao primo: se você continuar contando para cima, os números recomeçam. No corpo finito de 7, por exemplo, 5 mais 2 é igual a zero e 5 mais 3 é igual a 1.

Introdução

Uma curva elíptica tem uma sequência de números associada, chamada ap, que se relaciona ao número de soluções existentes para a curva no corpo finito definido pelo primo p. Um menor ap significa mais soluções; um maior ap significa menos soluções. Embora a classificação seja difícil de calcular, a sequência ap é muito mais fácil.

Com base em numerosos cálculos feitos em um dos primeiros computadores, Birch e Swinnerton-Dyer conjecturaram uma relação entre a classificação de uma curva elíptica e a sequência ap. Qualquer um que puder provar que estava certo ganhará um milhão de dólares e a imortalidade matemática.

Surge um padrão surpresa

Após o início da pandemia, Yang Hui Ele, pesquisador do Instituto de Ciências Matemáticas de Londres, decidiu enfrentar alguns novos desafios. Ele se formou em física na faculdade e obteve seu doutorado em física matemática pelo Massachusetts Institute of Technology. Mas ele estava cada vez mais interessado na teoria dos números e, dadas as crescentes capacidades da inteligência artificial, pensou em tentar usar a IA como ferramenta para encontrar padrões inesperados em números. (Ele já estava usando aprendizado de máquina classificar Variedades Calabi-Yau, estruturas matemáticas que são amplamente utilizadas na teoria das cordas.)

Introdução

Em agosto de 2020, à medida que a pandemia se aprofundava, a Universidade de Nottingham acolheu-o para uma conversa online. Ele estava pessimista quanto ao seu progresso e quanto à própria possibilidade de usar o aprendizado de máquina para descobrir novas matemáticas. “Sua narrativa era que a teoria dos números era difícil porque não era possível aprender coisas por máquina na teoria dos números”, disse Tomás Oliver, um matemático da Universidade de Westminster que estava na plateia. Como Ele lembra: “Não consegui encontrar nada porque não era um especialista. Eu nem estava usando as coisas certas para ver isso.”

Oliver e Kyu Hwan Lee, um matemático da Universidade de Connecticut, começou a trabalhar com He. “Decidimos fazer isso apenas para aprender o que era aprendizado de máquina, em vez de estudar matemática seriamente”, disse Oliver. “Mas rapidamente descobrimos que era possível aprender muitas coisas com a máquina.”

Oliver e Lee sugeriram que Ele aplicasse suas técnicas para examinar L-funções, séries infinitas intimamente relacionadas a curvas elípticas através da sequência ap. Eles poderiam usar um banco de dados on-line de curvas elípticas e suas respectivas L-funções chamadas de LMFDB para treinar seus classificadores de aprendizado de máquina. Na época, o banco de dados tinha pouco mais de 3 milhões de curvas elípticas sobre os racionais. Em outubro de 2020, eles tinham um papel que usou informações coletadas L-funções para prever uma propriedade específica de curvas elípticas. Em novembro eles compartilharam outro papel que usou aprendizado de máquina para classificar outros objetos na teoria dos números. Em dezembro, eles conseguiram prever as classificações das curvas elípticas com alta precisão.

Mas eles não sabiam por que seus algoritmos de aprendizado de máquina funcionavam tão bem. Lee perguntou a seu aluno Alexey Pozdnyakov para ver se ele conseguia descobrir o que estava acontecendo. Na verdade, o LMFDB classifica as curvas elípticas de acordo com uma quantidade chamada condutor, que resume informações sobre números primos para os quais uma curva não se comporta bem. Então Pozdnyakov tentou observar simultaneamente um grande número de curvas com condutores semelhantes – digamos, todas as curvas com condutores entre 7,500 e 10,000.

Introdução

Isso totalizou cerca de 10,000 curvas no total. Cerca de metade deles tinha classificação 0 e metade, classificação 1. (Classificações mais altas são extremamente raras.) Ele então calculou a média dos valores de ap para todas as curvas de classificação 0, calculadas separadamente ap para todas as curvas de classificação 1 e plotou os resultados. Os dois conjuntos de pontos formaram duas ondas distintas e facilmente discerníveis. Foi por isso que os classificadores de aprendizado de máquina conseguiram determinar corretamente as classificações de curvas específicas.

“No início, fiquei feliz por ter concluído a tarefa”, disse Pozdnyakov. “Mas Kyu-Hwan reconheceu imediatamente que esse padrão era surpreendente e foi então que se tornou realmente emocionante.”

Lee e Oliver ficaram encantados. “Alexey nos mostrou a foto e eu disse que se parece com aquela coisa que os pássaros fazem”, disse Oliver. “E então Kyu-Hwan pesquisou e disse que se chamava murmuração, e então Yang disse que deveríamos ligar para o jornal.Murmúrios de curvas elípticas. '"

Eles carregaram seu artigo em abril de 2022 e o encaminharam para um punhado de outros matemáticos, esperando nervosamente ser informados de que sua chamada “descoberta” era bem conhecida. Oliver disse que o relacionamento era tão visível que deveria ter sido notado há muito tempo.

Introdução

Quase imediatamente, a pré-impressão despertou interesse, especialmente de André Sutherland, pesquisador do MIT e um dos editores-chefe do LMFDB. Sutherland percebeu que 3 milhões de curvas elípticas não eram suficientes para seus propósitos. Ele queria observar faixas de condutores muito maiores para ver quão robustas eram as murmurações. Ele extraiu dados de outro imenso repositório de cerca de 150 milhões de curvas elípticas. Ainda insatisfeito, ele retirou dados de um repositório diferente com 300 milhões de curvas.

“Mas mesmo isso não foi suficiente, então calculei um novo conjunto de dados de mais de um bilhão de curvas elípticas, e foi isso que usei para calcular as imagens de alta resolução”, disse Sutherland. Os murmúrios apareciam quer ele calculasse a média de mais de 15,000 mil curvas elípticas por vez ou de um milhão de cada vez. A forma permaneceu a mesma mesmo quando ele olhou para as curvas de números primos cada vez maiores, um fenômeno chamado invariância de escala. Sutherland também percebeu que as murmurações não são exclusivas das curvas elípticas, mas também aparecem de forma mais geral. L-funções. Ele escreveu uma carta resumindo suas descobertas e enviou para Sarnak e Michael Rubinstein na Universidade de Waterloo.

“Se houver uma explicação conhecida para isso, espero que você a saiba”, escreveu Sutherland.

Eles não fizeram.

Explicando o padrão

Lee, He e Oliver organizaram um workshop sobre murmurações em agosto de 2023 no Instituto de Pesquisa Computacional e Experimental em Matemática (ICERM) da Brown University. Sarnak e Rubinstein vieram, assim como o aluno de Sarnak Nina Zubrilina.

Zubrilina apresentou sua pesquisa sobre padrões de murmuração em formas modulares, funções complexas especiais que, como curvas elípticas, associaram L-funções. Em formas modulares com grandes condutores, os murmúrios convergem para uma curva bem definida, em vez de formar um padrão discernível, mas disperso. Em um papel postado em 11 de outubro de 2023, Zubrilina comprovou que esse tipo de murmuração segue uma fórmula explícita que ela descobriu.

“A grande conquista de Nina é que ela recebeu uma fórmula para isso; Eu chamo isso de fórmula de densidade de murmuração Zubrilina”, disse Sarnak. “Usando matemática muito sofisticada, ela provou uma fórmula exata que se ajusta perfeitamente aos dados.”

Sua fórmula é complicada, mas Sarnak a considera um novo tipo importante de função, comparável às funções de Airy que definem soluções para equações diferenciais usadas em uma variedade de contextos da física, desde a óptica até a mecânica quântica.

Embora a fórmula de Zubrilina tenha sido a primeira, outras se seguiram. “Toda semana sai um novo artigo”, disse Sarnak, “principalmente usando as ferramentas de Zubrilina, explicando outros aspectos das murmurações”.

Jonathan Bobber, André Booker e Min lee da Universidade de Bristol, juntamente com David Lowry-Duda do ICERM, comprovou a existência de um tipo diferente de murmuração em formas modulares em outro jornal de outubro. E Kyu-Hwan Lee, Oliver e Pozdnyakov provou a existência de murmurações em objetos chamados caracteres de Dirichlet que estão intimamente relacionados com L-funções.

Sutherland ficou impressionado com a significativa dose de sorte que levou à descoberta das murmurações. Se os dados da curva elíptica não tivessem sido ordenados por condutor, os murmúrios teriam desaparecido. “Eles tiveram a sorte de obter dados do LMFDB, que vieram pré-classificados de acordo com o condutor”, disse ele. “É o que relaciona uma curva elíptica com a forma modular correspondente, mas isso não é nada óbvio. … Duas curvas cujas equações parecem muito semelhantes podem ter condutores muito diferentes.” Por exemplo, Sutherland observou que y2 = x3 - 11x + 6 tem o condutor 17, mas mudando o sinal de menos para um sinal de mais, y2 = x3 + 11x + 6 tem condutor 100,736.

Mesmo assim, as murmurações só foram encontradas por causa da inexperiência de Pozdnyakov. “Não acho que teríamos encontrado isso sem ele”, disse Oliver, “porque os especialistas tradicionalmente normalizam ap ter valor absoluto 1. Mas ele não as normalizou… então as oscilações foram muito grandes e visíveis.”

Os padrões estatísticos que os algoritmos de IA usam para classificar curvas elípticas por classificação existem em um espaço de parâmetros com centenas de dimensões – muitos para as pessoas classificarem em suas mentes, quanto mais visualizarem, observou Oliver. Mas embora o aprendizado de máquina tenha encontrado as oscilações ocultas, “só mais tarde entendemos que eram murmurações”.

Nota do Editor: Andrew Sutherland, Kyu-Hwan Lee e o banco de dados de funções L e formulários modulares (LMFDB) receberam financiamento da Simons Foundation, que também financia esta publicação editorialmente independente. As decisões de financiamento da Fundação Simons não têm influência na nossa cobertura. Mais informações estão disponíveis SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

Carimbo de hora:

Mais de Quantagazine