Los investigadores descubren un enfoque más flexible para el aprendizaje automático

Los investigadores descubren un enfoque más flexible para el aprendizaje automático

Los investigadores descubren un enfoque más flexible para el aprendizaje automático: Inteligencia de datos PlatoBlockchain. Búsqueda vertical. Ai.

Introducción

Los investigadores de inteligencia artificial han celebrado una serie de éxitos con redes neuronales, programas de computadora que imitan aproximadamente cómo están organizados nuestros cerebros. Pero a pesar del rápido progreso, las redes neuronales siguen siendo relativamente inflexibles, con poca capacidad para cambiar sobre la marcha o adaptarse a circunstancias desconocidas.

En 2020, dos investigadores del Instituto Tecnológico de Massachusetts dirigieron un equipo que presentó un nuevo tipo de red neuronal basado en inteligencia de la vida real, pero no en la nuestra. En cambio, se inspiraron en el diminuto gusano redondo, Caenorhabditis elegans, para producir lo que llamaron redes neuronales líquidas. Después de un gran avance el año pasado, las redes novedosas ahora pueden ser lo suficientemente versátiles como para suplantar a sus contrapartes tradicionales para ciertas aplicaciones.

Las redes neuronales líquidas ofrecen "una alternativa elegante y compacta", dijo Ken Goldberg, especialista en robótica de la Universidad de California, Berkeley. Agregó que los experimentos ya están mostrando que estas redes pueden funcionar más rápido y con mayor precisión que otras llamadas redes neuronales de tiempo continuo, que modelan sistemas que varían con el tiempo.

ramin hasani y Mathias Lechner, las fuerzas impulsoras detrás del nuevo diseño, se dieron cuenta hace años de que C. elegans podría ser un organismo ideal para descubrir cómo crear redes neuronales resistentes que puedan adaptarse a la sorpresa. El alimentador inferior de un milímetro de largo se encuentra entre las pocas criaturas con un sistema nervioso completamente mapeado, y es capaz de una variedad de comportamientos avanzados: moverse, encontrar comida, dormir, aparearse e incluso aprender de la experiencia. “Vive en el mundo real, donde el cambio siempre está ocurriendo, y puede funcionar bien en casi cualquier condición que se le presente”, dijo Lechner.

El respeto por el humilde gusano lo llevó a él y a Hasani a sus nuevas redes líquidas, donde cada neurona se rige por una ecuación que predice su comportamiento a lo largo del tiempo. Y así como las neuronas están vinculadas entre sí, estas ecuaciones dependen unas de otras. La red esencialmente resuelve todo este conjunto de ecuaciones vinculadas, lo que le permite caracterizar el estado del sistema en un momento dado, lo que se aleja de las redes neuronales tradicionales, que solo brindan los resultados en momentos particulares.

“[Ellos] solo pueden decirle lo que está sucediendo en uno, dos o tres segundos”, dijo Lechner. "Pero un modelo de tiempo continuo como el nuestro puede describir lo que sucede en 0.53 segundos o 2.14 segundos o en cualquier otro momento que elija".

Las redes líquidas también difieren en cómo tratan las sinapsis, las conexiones entre las neuronas artificiales. La fuerza de esas conexiones en una red neuronal estándar se puede expresar con un solo número, su peso. En redes líquidas, el intercambio de señales entre neuronas es un proceso probabilístico gobernado por una función “no lineal”, lo que significa que las respuestas a las entradas no siempre son proporcionales. Una duplicación de la entrada, por ejemplo, podría conducir a un cambio mucho mayor o menor en la salida. Esta variabilidad incorporada es la razón por la cual las redes se denominan "líquidas". La forma en que reacciona una neurona puede variar según la entrada que recibe.

Introducción

Si bien los algoritmos en el corazón de las redes tradicionales se configuran durante el entrenamiento, cuando estos sistemas reciben una gran cantidad de datos para calibrar los mejores valores para sus pesos, las redes neuronales líquidas son más adaptables. "Son capaces de cambiar sus ecuaciones subyacentes en función de la entrada que observan", cambiando específicamente la rapidez con la que responden las neuronas, dijo Daniela Rus, director del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT.

Una de las primeras pruebas para mostrar esta habilidad implicó intentar conducir un automóvil autónomo. Una red neuronal convencional solo podría analizar los datos visuales de la cámara del automóvil a intervalos fijos. La red líquida, que consta de 19 neuronas y 253 sinapsis (lo que la hace minúscula según los estándares del aprendizaje automático), podría ser mucho más sensible. “Nuestro modelo puede tomar muestras con más frecuencia, por ejemplo, cuando la carretera tiene curvas”, dijo Rus, coautor de este y varios otros artículos sobre redes líquidas.

El modelo logró mantener el auto en la pista, pero tenía un defecto, dijo Lechner: “Era muy lento”. El problema surgió de las ecuaciones no lineales que representan las sinapsis y las neuronas, ecuaciones que generalmente no se pueden resolver sin cálculos repetidos en una computadora, que pasa por múltiples iteraciones antes de finalmente converger en una solución. Este trabajo generalmente se delega a paquetes de software dedicados llamados solucionadores, que deberían aplicarse por separado a cada sinapsis y neurona.

En un papel el año pasado, el equipo reveló una nueva red neuronal líquida que sorteó ese cuello de botella. Esta red se basó en el mismo tipo de ecuaciones, pero el avance clave fue el descubrimiento de Hasani de que estas ecuaciones no necesitaban ser resueltas mediante arduos cálculos informáticos. En cambio, la red podría funcionar utilizando una solución casi exacta o de “forma cerrada” que, en principio, podría resolverse con lápiz y papel. Por lo general, estas ecuaciones no lineales no tienen soluciones de forma cerrada, pero Hasani encontró una solución aproximada que era lo suficientemente buena para usar.

“Tener una solución de forma cerrada significa que tiene una ecuación para la cual puede ingresar los valores de sus parámetros y hacer los cálculos básicos, y obtiene una respuesta”, dijo Rus. "Obtienes una respuesta de una sola vez", en lugar de dejar que una computadora trabaje hasta que decida que está lo suficientemente cerca. Eso reduce el tiempo computacional y la energía, acelerando considerablemente el proceso.

“Su método supera a la competencia en varios órdenes de magnitud sin sacrificar la precisión”, dijo Sayán Mitra, científico informático de la Universidad de Illinois, Urbana-Champaign.

Además de ser más rápido, dijo Hasani, sus redes más nuevas también son inusualmente estables, lo que significa que el sistema puede manejar enormes entradas sin descontrolarse. "La principal contribución aquí es que la estabilidad y otras buenas propiedades se integran en estos sistemas por su estructura pura", dijo Sriram Sankaranarayanan, científico informático de la Universidad de Colorado, Boulder. Las redes líquidas parecen operar en lo que él llamó "el punto óptimo: son lo suficientemente complejas como para permitir que sucedan cosas interesantes, pero no tan complejas como para conducir a un comportamiento caótico".

En este momento, el grupo MIT está probando su última red en un dron aéreo autónomo. Aunque el dron fue entrenado para navegar en un bosque, lo trasladaron al entorno urbano de Cambridge para ver cómo maneja las condiciones novedosas. Lechner calificó los resultados preliminares de alentadores.

Más allá de refinar el modelo actual, el equipo también está trabajando para mejorar la arquitectura de su red. El siguiente paso, dijo Lechner, "es averiguar cuántas o pocas neuronas necesitamos realmente para realizar una tarea determinada". El grupo también quiere idear una forma óptima de conectar las neuronas. Actualmente, cada neurona se vincula con todas las demás neuronas, pero no es así como funciona en C. elegans, donde las conexiones sinápticas son más selectivas. A través de más estudios del sistema de cableado del gusano redondo, esperan determinar qué neuronas en su sistema deben acoplarse.

Además de aplicaciones como la conducción y el vuelo autónomos, las redes líquidas parecen muy adecuadas para el análisis de redes eléctricas, transacciones financieras, clima y otros fenómenos que fluctúan con el tiempo. Además, dijo Hasani, la última versión de las redes líquidas se puede usar "para realizar simulaciones de actividad cerebral a una escala que antes no era posible".

Mitra está particularmente intrigado por esta posibilidad. “En cierto modo, es un poco poético, mostrando que esta investigación puede estar cerrando el círculo”, dijo. "Las redes neuronales se están desarrollando hasta el punto de que las mismas ideas que hemos extraído de la naturaleza pronto pueden ayudarnos a comprender mejor la naturaleza".

Sello de tiempo:

Mas de Revista Quanta