I ricercatori scoprono un approccio più flessibile all'apprendimento automatico

I ricercatori scoprono un approccio più flessibile all'apprendimento automatico

I ricercatori scoprono un approccio più flessibile al machine learning PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Introduzione

I ricercatori di intelligenza artificiale hanno celebrato una serie di successi con reti neurali, programmi per computer che imitano approssimativamente il modo in cui è organizzato il nostro cervello. Ma nonostante i rapidi progressi, le reti neurali rimangono relativamente poco flessibili, con poca capacità di cambiare al volo o adattarsi a circostanze non familiari.

Nel 2020, due ricercatori del Massachusetts Institute of Technology hanno guidato un team che ha introdotto un nuovo tipo di rete neurale basato sull'intelligenza della vita reale, ma non sulla nostra. Invece, si sono ispirati al minuscolo nematode, Caenorhabditis elegans, per produrre quelle che chiamavano reti neurali liquide. Dopo una svolta lo scorso anno, le nuove reti potrebbero ora essere abbastanza versatili da soppiantare le loro controparti tradizionali per determinate applicazioni.

Le reti neurali liquide offrono "un'alternativa elegante e compatta", ha affermato KenGoldberg, un robotico dell'Università della California, Berkeley. Ha aggiunto che gli esperimenti stanno già dimostrando che queste reti possono funzionare più velocemente e con maggiore precisione rispetto ad altre cosiddette reti neurali a tempo continuo, che modellano sistemi che variano nel tempo.

Ramin Hasani ed Mattia Lechner, le forze trainanti dietro il nuovo design, realizzato anni fa che C. elegans potrebbe essere un organismo ideale da utilizzare per capire come creare reti neurali resilienti in grado di accogliere la sorpresa. L'alimentatore inferiore lungo un millimetro è tra le poche creature con un sistema nervoso completamente mappato ed è capace di una serie di comportamenti avanzati: muoversi, trovare cibo, dormire, accoppiarsi e persino imparare dall'esperienza. "Vive nel mondo reale, dove il cambiamento è sempre in atto, e può funzionare bene in quasi tutte le condizioni che gli si presentano", ha detto Lechner.

Il rispetto per l'umile verme ha portato lui e Hasani alle loro nuove reti liquide, dove ogni neurone è governato da un'equazione che ne prevede il comportamento nel tempo. E proprio come i neuroni sono collegati tra loro, queste equazioni dipendono l'una dall'altra. La rete risolve essenzialmente l'intero insieme di equazioni collegate, permettendole di caratterizzare lo stato del sistema in un dato momento - un allontanamento dalle tradizionali reti neurali, che danno i risultati solo in particolari momenti nel tempo.

"[Loro] possono solo dirti cosa sta succedendo in uno, due o tre secondi", ha detto Lechner. "Ma un modello a tempo continuo come il nostro può descrivere cosa sta succedendo a 0.53 secondi o 2.14 secondi o in qualsiasi altro momento tu scelga."

Le reti liquide differiscono anche nel modo in cui trattano le sinapsi, le connessioni tra i neuroni artificiali. La forza di queste connessioni in una rete neurale standard può essere espressa da un singolo numero, il suo peso. Nelle reti liquide, lo scambio di segnali tra neuroni è un processo probabilistico governato da una funzione “non lineare”, nel senso che le risposte agli input non sono sempre proporzionali. Un raddoppio dell'input, ad esempio, potrebbe portare a uno spostamento molto più grande o più piccolo dell'output. Questa variabilità incorporata è il motivo per cui le reti sono chiamate "liquide". Il modo in cui un neurone reagisce può variare a seconda dell'input che riceve.

Introduzione

Mentre gli algoritmi al centro delle reti tradizionali vengono impostati durante l'addestramento, quando questi sistemi vengono alimentati con grandi quantità di dati per calibrare i valori migliori per i loro pesi, le reti neurali liquide sono più adattabili. "Sono in grado di modificare le loro equazioni sottostanti in base all'input che osservano", modificando in particolare la velocità di risposta dei neuroni, ha affermato Daniela Rus, direttore del Computer Science and Artificial Intelligence Laboratory del MIT.

Uno dei primi test per mostrare questa capacità ha comportato il tentativo di guidare un'auto autonoma. Una rete neurale convenzionale potrebbe solo analizzare i dati visivi dalla telecamera dell'auto a intervalli fissi. La rete liquida, composta da 19 neuroni e 253 sinapsi (rendendola minuscola per gli standard dell'apprendimento automatico), potrebbe essere molto più reattivo. "Il nostro modello può campionare più frequentemente, ad esempio quando la strada è tortuosa", ha affermato Rus, coautore di questo e di molti altri articoli sulle reti liquide.

Il modello ha mantenuto con successo l'auto in pista, ma aveva un difetto, ha detto Lechner: "Era davvero lento". Il problema derivava dalle equazioni non lineari che rappresentano le sinapsi e i neuroni, equazioni che di solito non possono essere risolte senza calcoli ripetuti su un computer, che passa attraverso più iterazioni prima di convergere alla fine su una soluzione. Questo lavoro è generalmente delegato a pacchetti software dedicati chiamati risolutori, che dovrebbero essere applicati separatamente a ogni sinapsi e neurone.

In un carta l'anno scorso, il team ha rivelato una nuova rete neurale liquida che ha aggirato il collo di bottiglia. Questa rete si basava sullo stesso tipo di equazioni, ma il progresso chiave fu la scoperta di Hasani che queste equazioni non dovevano essere risolte attraverso ardui calcoli al computer. Invece, la rete potrebbe funzionare utilizzando una soluzione quasi esatta, o "in forma chiusa", che potrebbe, in linea di principio, essere elaborata con carta e matita. Tipicamente, queste equazioni non lineari non hanno soluzioni in forma chiusa, ma Hasani trovò una soluzione approssimata che era abbastanza buona da usare.

"Avere una soluzione in forma chiusa significa che hai un'equazione per la quale puoi inserire i valori per i suoi parametri e fare la matematica di base, e ottieni una risposta", ha detto Rus. "Ottieni una risposta in un solo colpo", piuttosto che lasciare che un computer macini fino a decidere che è abbastanza vicino. Ciò riduce il tempo e l'energia di calcolo, accelerando notevolmente il processo.

"Il loro metodo sta battendo la concorrenza di diversi ordini di grandezza senza sacrificare la precisione", ha affermato Saiyan Mitra, un informatico dell'Università dell'Illinois, Urbana-Champaign.

Oltre ad essere più veloci, ha affermato Hasani, le loro reti più recenti sono anche insolitamente stabili, il che significa che il sistema può gestire enormi input senza andare in tilt. "Il contributo principale qui è che la stabilità e altre buone proprietà sono integrate in questi sistemi dalla loro struttura pura", ha affermato Sriram Sankaranarayanan, un informatico dell'Università del Colorado, Boulder. Le reti liquide sembrano operare in quello che ha definito "il punto debole: sono abbastanza complesse da consentire che accadano cose interessanti, ma non così complesse da portare a comportamenti caotici".

Al momento, il gruppo del MIT sta testando la sua ultima rete su un drone aereo autonomo. Sebbene il drone sia stato addestrato per navigare in una foresta, l'hanno spostato nell'ambiente urbano di Cambridge per vedere come gestisce nuove condizioni. Lechner ha definito i risultati preliminari incoraggianti.

Oltre a perfezionare il modello attuale, il team sta anche lavorando per migliorare l'architettura della propria rete. Il passo successivo, ha detto Lechner, "è capire di quanti, o quanti pochi, neuroni abbiamo effettivamente bisogno per svolgere un determinato compito". Il gruppo vuole anche escogitare un modo ottimale per connettere i neuroni. Attualmente, ogni neurone si collega a ogni altro neurone, ma non è così che funziona C. elegans, dove le connessioni sinaptiche sono più selettive. Attraverso ulteriori studi sul sistema di cablaggio del nematode, sperano di determinare quali neuroni nel loro sistema dovrebbero essere accoppiati insieme.

Oltre ad applicazioni come la guida e il volo autonomi, le reti liquide sembrano adatte all'analisi delle reti elettriche, delle transazioni finanziarie, del tempo e di altri fenomeni che fluttuano nel tempo. Inoltre, ha affermato Hasani, l'ultima versione delle reti liquide può essere utilizzata "per eseguire simulazioni dell'attività cerebrale su una scala non realizzabile prima".

Mitra è particolarmente incuriosito da questa possibilità. "In un certo senso, è quasi poetico, mostrando che questa ricerca potrebbe chiudere il cerchio", ha detto. "Le reti neurali si stanno sviluppando al punto che le stesse idee che abbiamo tratto dalla natura potrebbero presto aiutarci a capire meglio la natura".

Timestamp:

Di più da Quantamagazine