Esparsas Redes Neurais Indicam aos Físicos Dados Úteis | Revista Quanta

Esparsas Redes Neurais Indicam aos Físicos Dados Úteis | Revista Quanta

Redes Neurais Esparsas Apontam aos Físicos Dados Úteis | Revista Quanta PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Introdução

Suponha que você tenha um livro de mil páginas, mas cada página tenha apenas uma única linha de texto. Você deve extrair as informações contidas no livro usando um scanner, só que esse scanner em particular percorre sistematicamente cada página, digitalizando uma polegada quadrada por vez. Você levaria muito tempo para ler o livro inteiro com aquele scanner, e a maior parte desse tempo seria desperdiçada digitalizando o espaço vazio. 

Essa é a vida de muitos físicos experimentais. Em experimentos de partículas, os detectores capturam e analisam grandes quantidades de dados, embora apenas uma pequena fração deles contenha informações úteis. “Em uma fotografia de, digamos, um pássaro voando no céu, cada pixel pode ser significativo”, explicou Kazuhiro Terao, um físico do SLAC National Accelerator Laboratory. Mas nas imagens que um físico olha, muitas vezes apenas uma pequena parte realmente importa. Em circunstâncias como essa, examinar cada detalhe desnecessariamente consome tempo e recursos computacionais.

Mas isso está começando a mudar. Com uma ferramenta de aprendizado de máquina conhecida como rede neural convolucional esparsa (SCNN), os pesquisadores podem se concentrar nas partes relevantes de seus dados e filtrar o resto. Os pesquisadores usaram essas redes para acelerar bastante sua capacidade de fazer análises de dados em tempo real. E eles planejam empregar SCNNs em experimentos futuros ou existentes em pelo menos três continentes. A mudança marca uma mudança histórica para a comunidade da física. 

“Na física, estamos acostumados a desenvolver nossos próprios algoritmos e abordagens computacionais”, disse Carlos Arguelles-Delgado, um físico da Universidade de Harvard. “Sempre estivemos na vanguarda do desenvolvimento, mas agora, no lado computacional das coisas, a ciência da computação está frequentemente liderando o caminho.” 

Caracteres Esparsos

O trabalho que daria origem aos SCNNs começou em 2012, quando Benjamin Graham, então na Universidade de Warwick, queria fazer uma rede neural que pudesse reconhecer a caligrafia chinesa. 

As principais ferramentas na época para tarefas relacionadas a imagens como essa eram as redes neurais convolucionais (CNNs). Para a tarefa de caligrafia chinesa, um escritor traçaria um caractere em um tablet digital, produzindo uma imagem de, digamos, 10,000 pixels. A CNN então moveria uma grade de 3 por 3 chamada kernel em toda a imagem, centralizando o kernel em cada pixel individualmente. Para cada colocação do kernel, a rede realizaria um cálculo matemático complicado chamado convolução que procurava características distintivas.

As CNNs foram projetadas para serem usadas com imagens densas de informações, como fotografias. Mas uma imagem contendo um caractere chinês está quase vazia; os pesquisadores referem-se aos dados com essa propriedade como esparsos. É uma característica comum de qualquer coisa no mundo natural. “Para dar um exemplo de como o mundo pode ser esparso”, disse Graham, se a Torre Eiffel fosse encaixada no menor retângulo possível, esse retângulo consistiria em “99.98% de ar e apenas 0.02% de ferro”.

Introdução

Graham tentou ajustar a abordagem da CNN para que o kernel fosse colocado apenas em seções de 3 por 3 da imagem que contivessem pelo menos um pixel com valor diferente de zero (e não apenas em branco). Desta forma, ele conseguiu produzir um sistema que poderia identificar com eficiência o chinês manuscrito. Ganhou uma competição em 2013 identificando caracteres individuais com uma taxa de erro de apenas 2.61%. (Humanos pontuaram 4.81% em média.) Em seguida, ele voltou sua atenção para um problema ainda maior: o reconhecimento de objetos tridimensionais.

Em 2017, Graham mudou-se para o Facebook AI Research e refinou ainda mais sua técnica e publicado que o detalhes para o primeiro SCNN, que centralizou o kernel apenas em pixels que tinham um valor diferente de zero (em vez de colocar o kernel em qualquer seção de 3 por 3 que tivesse pelo menos um pixel “diferente de zero”). Foi essa ideia geral que Terao trouxe para o mundo da física de partículas.

Cenas Subterrâneas

Terao está envolvido com experimentos no Fermi National Accelerator Laboratory que investigam a natureza dos neutrinos, uma das partículas elementares conhecidas mais elusivas. Eles também são as partículas mais abundantes no universo com massa (embora não muito), mas raramente aparecem dentro de um detector. Como resultado, a maioria dos dados para experimentos com neutrinos é esparsa, e Terao estava constantemente à procura de melhores abordagens para a análise de dados. Ele encontrou um em SCNNs.

Em 2019, ele aplicou SCNNs a simulações dos dados esperados do Deep Underground Neutrino Experiment, ou DUNE, que será o maior experimento de física de neutrinos do mundo quando estiver online em 2026. O projeto disparará neutrinos do Fermilab, nos arredores de Chicago, através de 800 milhas de terra para um laboratório subterrâneo em South Dakota. Ao longo do caminho, as partículas irão “oscilar” entre os três tipos conhecidos de neutrinos, e essas oscilações podem revelar propriedades detalhadas dos neutrinos.

Os SCNNs analisaram os dados simulados mais rapidamente do que os métodos comuns e exigiram significativamente menos poder computacional ao fazê-lo. Os resultados promissores significam que os SCNNs provavelmente serão usados ​​durante a execução experimental real.

Enquanto isso, em 2021, Terao ajudou a adicionar SCNNs a outro experimento de neutrinos no Fermilab conhecido como MicroBooNE. Aqui, os cientistas observam as consequências das colisões entre neutrinos e os núcleos de átomos de argônio. Ao examinar os rastros criados por essas interações, os pesquisadores podem inferir detalhes sobre os neutrinos originais. Para fazer isso, eles precisam de um algoritmo que possa olhar para os pixels (ou, tecnicamente, suas contrapartes tridimensionais chamadas voxels) em uma representação tridimensional do detector e determinar quais pixels estão associados a quais trajetórias de partículas.

Como os dados são tão escassos – um punhado de linhas minúsculas dentro de um grande detector (aproximadamente 170 toneladas de argônio líquido) – os SCNNs são quase perfeitos para essa tarefa. Com uma CNN padrão, a imagem teria que ser quebrada em 50 pedaços, por causa de toda a computação a ser feita, disse Terao. “Com uma CNN esparsa, analisamos a imagem inteira de uma vez – e fazemos isso muito mais rápido.”

Gatilhos oportunos

Um dos pesquisadores que trabalhou no MicroBooNE era um estagiário de graduação chamado Felix Yu. Impressionado com o poder e a eficiência dos SCNNs, ele levou as ferramentas consigo para seu próximo local de trabalho como estudante de pós-graduação em um laboratório de pesquisa de Harvard formalmente afiliado ao Observatório de Neutrinos IceCube no Pólo Sul.

Um dos principais objetivos do observatório é interceptar os neutrinos mais energéticos do universo e rastreá-los até suas fontes, a maioria das quais se encontra fora de nossa galáxia. O detector é composto por 5,160 sensores ópticos enterrados no gelo antártico, apenas uma pequena fração dos quais acende a qualquer momento. O restante da matriz permanece escuro e não é particularmente informativo. Pior ainda, muitos dos “eventos” que os detectores registram são falsos positivos e não são úteis para a caça de neutrinos. Apenas os chamados eventos de nível de gatilho são cortados para análise posterior, e decisões instantâneas precisam ser tomadas sobre quais deles são dignos dessa designação e quais serão permanentemente ignorados.

As CNNs padrão são muito lentas para esta tarefa, então os cientistas do IceCube há muito confiam em um algoritmo chamado LineFit para informá-los sobre detecções potencialmente úteis. Mas esse algoritmo não é confiável, disse Yu, “o que significa que podemos estar perdendo eventos interessantes”. Novamente, é um ambiente de dados esparsos ideal para um SCNN.

Yu — junto com Argüelles-Delgado, seu orientador de doutorado, e Jeff Lazar, aluno de pós-graduação da Universidade de Wisconsin, Madison — quantificou essa vantagem, mostrando em um artigo recente que essas redes seriam cerca de 20 vezes mais rápidas que as CNNs típicas. “Isso é rápido o suficiente para ser executado em todos os eventos que saem do detector”, cerca de 3,000 por segundo, disse Lazar. “Isso nos permite tomar melhores decisões sobre o que jogar fora e o que manter.”

Introdução

Os autores também empregaram com sucesso um SCNN em uma simulação usando dados oficiais do IceCube, e o próximo passo é testar seu sistema em uma réplica do sistema de computação do Pólo Sul. Se tudo correr bem, Argüelles-Delgado acredita que eles devem instalar seu sistema no observatório da Antártica no próximo ano. Mas a tecnologia pode ter um uso ainda mais amplo. “Achamos que [os SCNNs poderiam beneficiar] todos os telescópios de neutrinos, não apenas o IceCube”, disse Argüelles-Delgado.

Além dos Neutrinos

Philip Harris, físico do Instituto de Tecnologia de Massachusetts, espera que os SCNNs possam ajudar no maior colisor de partículas de todos: o Grande Colisor de Hádrons (LHC) no CERN. Harris ouviu falar desse tipo de rede neural de um colega do MIT, o cientista da computação Song Han. “Song é um especialista em tornar os algoritmos rápidos e eficientes”, disse Harris – perfeito para o LHC, onde ocorrem 40 milhões de colisões a cada segundo.

Quando eles conversaram alguns anos atrás, Song contou a Harris sobre um projeto de veículo autônomo que ele estava realizando com membros de seu laboratório. A equipe de Song estava usando SCNNs para analisar mapas a laser 3D do espaço à frente do veículo, grande parte do qual está vazio, para ver se havia alguma obstrução à frente.

Harris e seus colegas enfrentam desafios semelhantes no LHC. Quando dois prótons colidem dentro da máquina, a colisão cria uma esfera em expansão feita de partículas. Quando uma dessas partículas atinge o coletor, ocorre uma chuva de partículas secundária. “Se você puder mapear toda a extensão dessa chuva”, disse Harris, “você pode determinar a energia da partícula que deu origem a ela”, que pode ser um objeto de interesse especial – algo como o bóson de Higgs, que os físicos descoberto em 2012, ou uma partícula de matéria escura, que os físicos ainda estão procurando.

“O problema que estamos tentando resolver se resume a conectar os pontos”, disse Harris, assim como um carro autônomo pode conectar os pontos de um mapa a laser para detectar uma obstrução.

Os SCNNs acelerariam a análise de dados no LHC em pelo menos um fator de 50, disse Harris. “Nosso objetivo final é colocar [SCNNs] no detector” – uma tarefa que levará pelo menos um ano de papelada e adesão adicional da comunidade. Mas ele e seus colegas estão esperançosos.

Ao todo, é cada vez mais provável que os SCNNs - uma ideia originalmente concebida no mundo da ciência da computação - em breve desempenhem um papel nos maiores experimentos já conduzidos em física de neutrinos (DUNE), astronomia de neutrinos (IceCube) e física de alta energia (o LHC). .

Graham disse que ficou agradavelmente surpreso ao saber que os SCNNs chegaram à física de partículas, embora não tenha ficado totalmente chocado. “Em um sentido abstrato”, disse ele, “uma partícula se movendo no espaço é um pouco como a ponta de uma caneta se movendo em um pedaço de papel”.

Carimbo de hora:

Mais de Quantagazine