De baixo para cima para cima para baixo: a cientista computacional Amanda Barnard fala sobre a beleza das simulações, aprendizado de máquina e como os dois se cruzam – Physics World

De baixo para cima para cima para baixo: a cientista computacional Amanda Barnard fala sobre a beleza das simulações, aprendizado de máquina e como os dois se cruzam – Physics World

Amanda Barnard
Especialista em interfaces Amanda Barnard é vice-diretora e líder de ciência da computação na Escola de Computação da Universidade Nacional Australiana. (Cortesia: Sitthixay Ditthavong/Canberra Times)

Desde o uso de supercomputadores para explorar novos tipos de materiais até o treinamento de modelos de aprendizado de máquina para estudar propriedades complexas em nanoescala, Cientista computacional australiana Amanda Barnard trabalha na interface da computação e da ciência de dados. Um professor sênior da Escola de Computação da Universidade Nacional Australiana, Barnard também é vice-diretor e líder de ciência da computação. Hoje em dia, ela usa uma variedade de métodos computacionais para resolver problemas nas ciências físicas, mas Barnard começou sua carreira como física, recebendo seu doutorado em física teórica da matéria condensada em 2003.

Depois de passar os anos seguintes como pós-doutorado no Centro de Materiais em Nanoescala no Laboratório Nacional de Argonne nos EUA, ela começou a ampliar seus interesses de pesquisa para abranger muitos aspectos da ciência computacional, incluindo o uso de aprendizado de máquina em nanotecnologia, ciência de materiais, química e medicina.

Um colega de ambos Instituto Australiano de Física e os votos de Royal Society of Chemistry, em 2022 Barnard foi nomeado Membro da Ordem da Austrália. Ela também ganhou vários prêmios, incluindo o Prêmio Feynman de Nanotecnologia 2014 (Teoria) e o Medalha de 2019 da Associação de Modeladores Moleculares da Australásia. Ela fala com Hamish Johnston sobre seu interesse em aplicar o aprendizado de máquina a uma série de problemas e sobre os desafios e recompensas de fazer administração universitária.

Você pode nos contar um pouco sobre o que você faz como cientista computacional?

A ciência computacional envolve projetar e usar modelos matemáticos para analisar problemas computacionalmente exigentes em muitas áreas da ciência e da engenharia. Isto inclui avanços na infraestrutura computacional e algoritmos que permitem aos pesquisadores desses diferentes domínios realizar experimentos computacionais em grande escala. De certa forma, a ciência computacional envolve pesquisa em computação de alto desempenho, e não apenas pesquisa utilizando um computador de alto desempenho.

Passamos a maior parte do nosso tempo em algoritmos e tentando descobrir como implementá-los de uma forma que faça melhor uso do hardware avançado; e esse hardware está mudando o tempo todo. Isto inclui simulações convencionais baseadas em modelos matemáticos desenvolvidos especificamente em diferentes domínios científicos, seja física, química ou outros. Também passamos muito tempo usando métodos de aprendizado de máquina (ML) e inteligência artificial (IA), a maioria dos quais foram desenvolvidos por cientistas da computação, tornando-se uma pesquisa muito interdisciplinar. Isto permite que um conjunto de novas abordagens sejam utilizadas em todas estas diferentes áreas científicas.

O aprendizado de máquina nos permite recuperar grande parte da complexidade que perdemos quando derivamos essas belas teorias

A simulação nasceu dos aspectos teóricos de cada área científica que, com alguns níveis convenientes de abstração, permitiram resolver as equações. Mas quando desenvolvemos essas teorias, elas eram quase uma simplificação excessiva do problema, o que foi feito na busca da elegância matemática ou apenas por uma questão de praticidade. O ML nos permite recuperar grande parte da complexidade que perdemos quando derivamos essas belas teorias. Mas, infelizmente, nem todo ML funciona bem com a ciência e, portanto, os cientistas computacionais gastam muito tempo tentando descobrir como aplicar esses algoritmos que nunca foram planejados para serem usados ​​para esses tipos de conjuntos de dados para superar alguns dos problemas que são experiente na interface. E essa é uma das áreas interessantes que eu gosto.

Você começou sua carreira como físico. O que fez você migrar para a ciência da computação?

A física é um excelente ponto de partida para praticamente qualquer coisa. Mas sempre estive no caminho da ciência da computação sem perceber. Durante meu primeiro projeto de pesquisa como estudante, usei métodos computacionais e fiquei instantaneamente fisgado. Adorei a codificação, desde a escrita do código até os resultados finais, e então soube imediatamente que os supercomputadores estavam destinados a ser meu instrumento científico. Foi emocionante pensar no que um cientista de materiais poderia fazer se conseguisse sempre produzir amostras perfeitas. Ou o que um químico poderia fazer se conseguisse remover todas as contaminações e ter reações perfeitas. O que poderíamos fazer se pudéssemos explorar ambientes hostis ou perigosos sem o risco de ferir alguém? E o mais importante, e se pudéssemos fazer todas essas coisas simultaneamente, sob demanda, sempre que tentássemos?

A beleza dos supercomputadores é que eles são o único instrumento que nos permite alcançar esta quase perfeição. O que mais me cativa é que posso não só reproduzir o que meus colegas conseguem fazer no laboratório, mas também fazer tudo o que eles não conseguem fazer no laboratório. Então, desde o início, minha física computacional estava em um computador. Minha química computacional evoluiu para materiais, informática de materiais e agora praticamente exclusivamente ML. Mas sempre me concentrei nos métodos de cada uma dessas áreas e acho que uma base em física me permite pensar de forma muito criativa sobre como abordar todas essas outras áreas computacionalmente.

Como o aprendizado de máquina difere das simulações clássicas de computador?

A maior parte da minha pesquisa agora é ML, provavelmente 80% dela. Ainda faço algumas simulações convencionais, pois elas me dão algo muito diferente. As simulações são fundamentalmente uma abordagem de baixo para cima. Começamos com alguma compreensão de um sistema ou problema, executamos uma simulação e, no final, obtemos alguns dados. O ML, por outro lado, é uma abordagem de cima para baixo. Começamos com os dados, executamos um modelo e depois terminamos com uma melhor compreensão do sistema ou problema. A simulação é baseada em regras determinadas pelas nossas teorias científicas estabelecidas, enquanto o ML é baseado em experiências e história. As simulações são frequentemente em grande parte determinísticas, embora existam alguns exemplos de métodos estocásticos, como Monte Carlo. O ML é amplamente estocástico, embora existam alguns exemplos que também são determinísticos.

Com simulações, consigo fazer extrapolações muito boas. Muitas das teorias que sustentam as simulações permitem-nos explorar áreas de um “espaço de configuração” (as coordenadas que determinam todos os estados possíveis de um sistema) ou áreas de um problema para as quais não temos dados ou informações. Por outro lado, o ML é muito bom em interpolar e preencher todas as lacunas e é muito bom para inferência.

Conceito de fluxo de dados

Na verdade, os dois métodos baseiam-se em tipos de lógica muito diferentes. A simulação é baseada em uma lógica “se-então-senão”, o que significa que se eu tiver um certo problema ou um certo conjunto de condições, então obterei uma resposta determinística ou então, computacionalmente, provavelmente irá falhar se você obtiver está errado. O ML, por outro lado, baseia-se numa lógica de “estimar-melhorar-repetir”, o que significa que sempre dará uma resposta. Essa resposta é sempre melhorável, mas pode nem sempre estar certa, então essa é outra diferença.

As simulações são intradisciplinares: têm uma relação muito próxima com o conhecimento do domínio e contam com a inteligência humana. Por outro lado, o ML é interdisciplinar: utilizando modelos desenvolvidos fora do domínio original, é agnóstico ao conhecimento do domínio e depende fortemente da inteligência artificial. É por isso que gosto de combinar as duas abordagens.

Você pode nos contar um pouco mais sobre como você usa o aprendizado de máquina em sua pesquisa?

Antes do advento do ML, os cientistas precisavam compreender muito bem as relações entre as entradas e as saídas. Tínhamos que ter a estrutura do modelo predeterminada antes de podermos resolvê-lo. Isso significava que precisávamos ter uma ideia da resposta antes de podermos procurá-la.

Podemos desenvolver a estrutura de uma expressão ou equação e resolvê-la ao mesmo tempo. Isso acelera o método científico e é outra razão pela qual gosto de usar o aprendizado de máquina

Quando você usa ML, as máquinas usam técnicas estatísticas e informações históricas para basicamente se programarem. Isso significa que podemos desenvolver a estrutura de uma expressão ou equação e resolvê-la ao mesmo tempo. Isso acelera o método científico e é outra razão pela qual gosto de usá-lo.

As técnicas de ML que uso são diversas. Existem muitos sabores e tipos diferentes de ML, assim como existem muitos tipos diferentes de física computacional ou métodos de física experimental. Eu uso o aprendizado não supervisionado, que se baseia inteiramente em variáveis ​​de entrada, e busca desenvolver “padrões ocultos” ou tentar encontrar dados representativos. Isso é útil para materiais em nanociência, quando ainda não fizemos experimentos para talvez medir uma propriedade, mas sabemos bastante sobre as condições de entrada que colocamos para desenvolver o material.

A aprendizagem não supervisionada pode ser útil para encontrar grupos de estruturas, denominados clusters, que possuem semelhanças no espaço de alta dimensão, ou estruturas puras e representativas (arquétipos ou protótipos) que descrevem o conjunto de dados como um todo. Também podemos transformar dados para mapeá-los para um espaço de dimensão inferior e revelar mais semelhanças que não eram anteriormente aparentes, de uma forma semelhante à que poderíamos mudar para o espaço recíproco na física.

Também uso ML supervisionado para encontrar relações e tendências, como relações estrutura-propriedade, que são importantes em materiais e nanociência. Isto inclui a classificação, onde temos um rótulo discreto. Digamos que já temos diferentes categorias de nanopartículas e, com base em suas características, queremos atribuí-las automaticamente a uma categoria ou outra, e ter certeza de que podemos separar facilmente essas classes com base apenas nos dados de entrada.

Eu uso aprendizado estatístico e aprendizado semissupervisionado também. A aprendizagem estatística, em particular, é útil na ciência, embora ainda não seja amplamente utilizada. Pensamos nisso como uma inferência causal muito utilizada em diagnósticos médicos, e que pode ser aplicada para diagnosticar eficazmente como um material, por exemplo, pode ser criado, e não apenas por que é criado.

Seu grupo de pesquisa inclui pessoas com uma ampla gama de interesses científicos. Você pode nos dar uma ideia de algumas das coisas que eles estão estudando?

Quando comecei na física, nunca pensei que estaria rodeado de um grupo tão incrível de pessoas inteligentes de diferentes áreas científicas. O cluster de ciência computacional da Universidade Nacional Australiana inclui cientistas ambientais, cientistas da terra, biólogos computacionais e bioinformáticos. Há também pesquisadores estudando genômica, neurociência computacional, química quântica, ciência dos materiais, física dos plasmas, astrofísica, astronomia, engenharia e – eu – nanotecnologia. Então somos um grupo diversificado.

Nosso grupo inclui Giuseppe Barça, que está desenvolvendo algoritmos que sustentam os pacotes de software de química quântica usados ​​em todo o mundo. Sua pesquisa está focada em como podemos aproveitar novos processadores, como aceleradores, e como podemos repensar como moléculas grandes podem ser particionadas e fragmentadas para que possamos combinar estrategicamente fluxos de trabalho massivamente paralelos. Ele também está nos ajudando a usar supercomputadores de forma mais eficiente, o que economiza energia. E nos últimos dois anos, ele manteve o recorde mundial no algoritmo de química quântica de melhor escalabilidade.

Também em pequena escala – em termos de ciência – é Minh Bui, que é bioinformático e trabalha no desenvolvimento de novos modelos estatísticos na área de sistemas filogenômicos [um campo multidisciplinar que combina pesquisa evolutiva com biologia de sistemas e ecologia, usando métodos da ciência de redes]. Estes incluem modelos de particionamento, modelos com reconhecimento de isomorfismo e modelos de árvore de distribuição. As aplicações disso incluem áreas em enzimas fotossintéticas ou dados profundos de transcrição de filogenia de insetos, e ele fez trabalhos investigando algas, bem como bactérias e vírus como HIV e SARS-CoV-2 (que causa o COVID-19).

Minh Bui

Na extremidade maior da escala está o matemático Quanling Deng, cuja pesquisa se concentra em modelagem matemática e simulação para meios de grande escala, como oceanos e dinâmica atmosférica, bem como blocos de gelo da Antártica.

A melhor parte é quando descobrimos que um problema de um domínio já foi resolvido em outro, e melhor ainda quando descobrimos um problema experimentado em vários domínios para que possamos escalar de forma superlinear. É ótimo quando uma solução tem múltiplas áreas de impacto. E com que frequência você encontraria um neurocientista computacional trabalhando ao lado de um físico de plasma? Isso normalmente não acontece.

Além de trabalhar com seu grupo de pesquisa, você também é vice-diretor da Escola de Computação da Universidade Nacional Australiana. Você pode nos contar um pouco sobre esse papel?

É em grande parte uma função administrativa. Assim, além de trabalhar com um grupo incrível de cientistas da computação em ciência de dados, áreas fundamentais em linguagens, desenvolvimento de software, segurança cibernética, visão computacional, robótica e assim por diante, também posso criar oportunidades para novas pessoas ingressarem na escola e serem a melhor versão de si mesmos. Muito do meu trabalho na função de liderança é sobre as pessoas. E isso inclui o recrutamento, cuidando do nosso programa de estabilidade e também do nosso programa de desenvolvimento profissional. Também tive a oportunidade de iniciar alguns novos programas em áreas que achei que precisavam de atenção.

Um exemplo foi durante a pandemia global de COVID. Muitos de nós fomos fechados e não conseguimos acessar nossos laboratórios, o que nos deixou imaginando o que poderíamos fazer. Aproveitei a oportunidade para desenvolver um programa chamado Bolsa Conjunta Jubileu, que apoia pesquisadores que trabalham na interface entre a ciência da computação e outro domínio, onde resolvem grandes desafios em suas áreas, mas também usam o conhecimento desse domínio para informar novos tipos de ciência da computação. O programa apoiou cinco desses investigadores em diferentes áreas em 2021.

Eu também sou o presidente do Programa Mulheres Pioneiras, que oferece bolsas de estudo, palestras e bolsas para apoiar mulheres que ingressam na computação e garantir que tenham sucesso ao longo de sua carreira conosco.

E, claro, uma das minhas outras funções como vice-diretor é cuidar das instalações informáticas da nossa escola. Procuro maneiras de diversificar nosso fluxo de recursos para superar tempos difíceis, como durante o COVID, quando não pudemos encomendar nenhum equipamento novo. Também analiso como podemos ser mais eficientes em termos energéticos, porque a computação utiliza uma enorme quantidade de energia.

Deve ser um momento muito emocionante para as pessoas que fazem pesquisas em ML, já que a tecnologia está encontrando muitos usos diferentes. Quais novas aplicações de ML você mais espera em sua pesquisa?

Bem, provavelmente alguns dos que você já ouviu falar, nomeadamente IA. Embora existam riscos associados à IA, também há enormes oportunidades, e penso que a IA generativa será particularmente importante nos próximos anos para a ciência – desde que consigamos ultrapassar alguns dos problemas com a “alucinação” [quando um sistema de IA , como um modelo de linguagem grande, gera informações falsas, com base em um conjunto de dados de treinamento ou em lógica contextual, ou em uma combinação de ambos].

Não importa em que área da ciência estejamos, estamos limitados pelo tempo que temos, pelo dinheiro, pelos recursos e pelos equipamentos aos quais temos acesso. Isso significa que estamos comprometendo nossa ciência para atender a essas limitações, em vez de nos concentrarmos em superá-las.

Mas não importa em que área da ciência estejamos, seja ela computacional ou experimental, todos sofremos uma série de restrições. Estamos limitados pelo tempo que temos, pelo dinheiro, pelos recursos e pelos equipamentos aos quais temos acesso. Significa que estamos a comprometer a nossa ciência para se adaptar a estas limitações, em vez de nos concentrarmos em superá-las. Eu realmente acredito que a infraestrutura não deveria ditar o que fazemos, deveria ser o contrário.

Penso que a IA generativa chegou no momento certo para nos permitir finalmente ultrapassar alguns destes problemas porque tem um grande potencial para preencher as lacunas e fornecer-nos uma ideia do que a ciência poderíamos ter feito, se tivéssemos todos os recursos necessários.

Na verdade, a IA poderia permitir-nos obter mais fazendo menos e evitar algumas armadilhas como o viés de seleção. Esse é um grande problema ao aplicar ML a conjuntos de dados científicos. Precisamos de trabalhar muito mais para garantir que os métodos generativos produzem ciência significativa e não alucinações. Isso é particularmente importante se eles formarem a base para grandes modelos pré-treinados. Mas acho que esta será uma era da ciência realmente emocionante, em que trabalharemos em colaboração com a IA, em vez de apenas realizar uma tarefa para nós.

Carimbo de hora:

Mais de Mundo da física