Pesquisadores descobrem uma abordagem mais flexível para aprendizado de máquina

Pesquisadores descobrem uma abordagem mais flexível para aprendizado de máquina

Pesquisadores descobrem uma abordagem mais flexível para aprendizado de máquina PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

Introdução

Pesquisadores de inteligência artificial celebraram uma série de sucessos com redes neurais, programas de computador que imitam aproximadamente como nossos cérebros são organizados. Mas, apesar do rápido progresso, as redes neurais permanecem relativamente inflexíveis, com pouca capacidade de mudar rapidamente ou de se ajustar a circunstâncias desconhecidas.

Em 2020, dois pesquisadores do Instituto de Tecnologia de Massachusetts lideraram uma equipe que apresentou um novo tipo de rede neural baseado na inteligência da vida real – mas não na nossa. Em vez disso, eles se inspiraram na pequena lombriga, Caenorhabditis elegans, para produzir o que chamaram de redes neurais líquidas. Após um avanço no ano passado, as novas redes podem agora ser suficientemente versáteis para suplantar as suas contrapartes tradicionais em determinadas aplicações.

As redes neurais líquidas oferecem “uma alternativa elegante e compacta”, disse Ken Goldberg, roboticista da Universidade da Califórnia, Berkeley. Ele acrescentou que experimentos já mostram que essas redes podem funcionar com mais rapidez e precisão do que outras chamadas redes neurais de tempo contínuo, que modelam sistemas que variam ao longo do tempo.

Ramin Hasani e Mathias Lechner, as forças motrizes por trás do novo design, perceberam anos atrás que C. elegans poderia ser um organismo ideal para descobrir como criar redes neurais resilientes que possam acomodar surpresas. O alimentador de fundo milimétrico está entre as poucas criaturas com um sistema nervoso totalmente mapeado e é capaz de uma série de comportamentos avançados: mover-se, encontrar comida, dormir, acasalar-se e até aprender com a experiência. “Ele vive no mundo real, onde mudanças estão sempre acontecendo, e pode funcionar bem sob quase todas as condições que lhe forem impostas”, disse Lechner.

O respeito pelo humilde verme levou ele e Hasani às suas novas redes líquidas, onde cada neurônio é governado por uma equação que prevê seu comportamento ao longo do tempo. E assim como os neurônios estão ligados entre si, essas equações dependem umas das outras. A rede resolve essencialmente todo esse conjunto de equações interligadas, permitindo caracterizar o estado do sistema em um determinado momento – um afastamento das redes neurais tradicionais, que só fornecem os resultados em determinados momentos.

“[Eles] só podem dizer o que está acontecendo em um, dois ou três segundos”, disse Lechner. “Mas um modelo de tempo contínuo como o nosso pode descrever o que está acontecendo em 0.53 segundos ou 2.14 segundos ou em qualquer outro momento que você escolher.”

As redes líquidas também diferem na forma como tratam as sinapses, as conexões entre neurônios artificiais. A força dessas conexões em uma rede neural padrão pode ser expressa por um único número, seu peso. Nas redes líquidas, a troca de sinais entre neurônios é um processo probabilístico governado por uma função “não linear”, o que significa que as respostas às entradas nem sempre são proporcionais. Uma duplicação do insumo, por exemplo, poderia levar a uma mudança muito maior ou menor no produto. Essa variabilidade incorporada é a razão pela qual as redes são chamadas de “líquidas”. A maneira como um neurônio reage pode variar dependendo da entrada que recebe.

Introdução

Embora os algoritmos no centro das redes tradicionais sejam definidos durante o treinamento, quando esses sistemas são alimentados com resmas de dados para calibrar os melhores valores para seus pesos, as redes neurais líquidas são mais adaptáveis. “Eles são capazes de mudar suas equações subjacentes com base nas informações que observam”, alterando especificamente a rapidez com que os neurônios respondem, disse Daniela Rus, diretor do Laboratório de Ciência da Computação e Inteligência Artificial do MIT.

Um dos primeiros testes para demonstrar essa habilidade envolveu a tentativa de dirigir um carro autônomo. Uma rede neural convencional só poderia analisar dados visuais da câmera do carro em intervalos fixos. A rede líquida – composta por 19 neurônios e 253 sinapses (o que a torna minúscula para os padrões de aprendizado de máquina) – poderia ser muito mais responsivo. “Nosso modelo pode coletar amostras com mais frequência, por exemplo, quando a estrada é sinuosa”, disse Rus, coautor deste e de vários outros artigos sobre redes líquidas.

O modelo manteve o carro na pista com sucesso, mas tinha uma falha, disse Lechner: “Era muito lento”. O problema resultou das equações não lineares que representam as sinapses e os neurônios – equações que geralmente não podem ser resolvidas sem cálculos repetidos em um computador, que passa por múltiplas iterações antes de finalmente convergir para uma solução. Esse trabalho normalmente é delegado a pacotes de software dedicados chamados solucionadores, que precisariam ser aplicados separadamente a cada sinapse e neurônio.

Em um artigo do papel no ano passado, a equipe revelou uma nova rede neural líquida que contornou esse gargalo. Essa rede dependia do mesmo tipo de equações, mas o principal avanço foi a descoberta de Hasani de que essas equações não precisavam ser resolvidas por meio de árduos cálculos computacionais. Em vez disso, a rede poderia funcionar utilizando uma solução quase exata, ou de “forma fechada”, que poderia, em princípio, ser elaborada com lápis e papel. Normalmente, essas equações não lineares não têm soluções fechadas, mas Hasani encontrou uma solução aproximada que era boa o suficiente para ser usada.

“Ter uma solução de forma fechada significa que você tem uma equação para a qual pode inserir os valores de seus parâmetros e fazer as contas básicas, e obter uma resposta”, disse Rus. “Você obtém uma resposta de uma só vez”, em vez de deixar o computador trabalhar até decidir que está perto o suficiente. Isso reduz o tempo e a energia computacional, acelerando consideravelmente o processo.

“O método deles está vencendo a concorrência em várias ordens de magnitude, sem sacrificar a precisão”, disse Sayan Mitra, cientista da computação da Universidade de Illinois, Urbana-Champaign.

Além de serem mais rápidas, disse Hasani, suas redes mais recentes também são excepcionalmente estáveis, o que significa que o sistema pode lidar com entradas enormes sem ficar confuso. “A principal contribuição aqui é que a estabilidade e outras propriedades interessantes são incorporadas a esses sistemas por sua estrutura completa”, disse Sriram Sankaranarayan, cientista da computação da Universidade do Colorado, Boulder. As redes líquidas parecem operar no que ele chamou de “ponto ideal: são complexas o suficiente para permitir que coisas interessantes aconteçam, mas não tão complexas a ponto de levar a um comportamento caótico”.

Neste momento, o grupo MIT está a testar a sua mais recente rede num drone aéreo autónomo. Embora o drone tenha sido treinado para navegar em uma floresta, eles o transferiram para o ambiente urbano de Cambridge para ver como ele lida com novas condições. Lechner considerou os resultados preliminares encorajadores.

Além de refinar o modelo atual, a equipe também está trabalhando para melhorar a arquitetura da rede. O próximo passo, disse Lechner, “é descobrir quantos ou quão poucos neurônios realmente precisamos para realizar uma determinada tarefa”. O grupo também quer desenvolver uma maneira ideal de conectar neurônios. Atualmente, cada neurônio se liga a todos os outros neurônios, mas não é assim que funciona C. elegans, onde as conexões sinápticas são mais seletivas. Através de estudos adicionais do sistema de fiação da lombriga, eles esperam determinar quais neurônios em seu sistema devem ser acoplados.

Além de aplicações como condução e voo autônomos, as redes líquidas parecem bem adequadas para a análise de redes de energia elétrica, transações financeiras, clima e outros fenômenos que flutuam ao longo do tempo. Além disso, disse Hasani, a versão mais recente das redes líquidas pode ser usada “para realizar simulações de atividade cerebral em uma escala não realizável antes”.

Mitra está particularmente intrigado com esta possibilidade. “De certa forma, é meio poético, mostrando que esta pesquisa pode estar fechando o círculo”, disse ele. “As redes neurais estão se desenvolvendo a tal ponto que as próprias ideias que extraímos da natureza poderão em breve nos ajudar a entendê-la melhor.”

Carimbo de hora:

Mais de Quantagazine