Un nuovo chip per computer fotonico utilizza la luce per ridurre i costi energetici dell’intelligenza artificiale

Un nuovo chip per computer fotonico utilizza la luce per ridurre i costi energetici dell’intelligenza artificiale

Un nuovo chip per computer fotonico utilizza la luce per ridurre drasticamente i costi energetici dell'intelligenza artificiale PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

I modelli di intelligenza artificiale lo sono maiali di potere.

Man mano che gli algoritmi crescono e diventano più complessi, mettono sempre più a dura prova gli attuali chip dei computer. Molte aziende hanno progettato chip su misura per l’intelligenza artificiale per ridurre il consumo di energia. Ma si basano tutti su una regola fondamentale: utilizzano l'elettricità.

Questo mese, un team dell’Università Tsinghua in Cina ha cambiato la ricetta. Essi costruito un chip di rete neurale che utilizza la luce anziché l’elettricità per eseguire attività di intelligenza artificiale a una frazione del costo energetico di H100 di NVIDIA, un chip all'avanguardia utilizzato per addestrare ed eseguire modelli di intelligenza artificiale.

Chiamato Taichi, il chip combina due tipi di elaborazione basata sulla luce nella sua struttura interna. Rispetto al precedente chip ottici, Taichi è molto più preciso per compiti relativamente semplici come riconoscere numeri scritti a mano o altre immagini. A differenza dei suoi predecessori, il chip può anche generare contenuti. Può creare immagini di base in uno stile basato sull'artista olandese Vincent van Gogh, ad esempio, o numeri musicali classici ispirati a Johann Sebastian Bach.

Parte dell'efficienza di Taichi è dovuta alla sua struttura. Il chip è costituito da più componenti chiamati chiplet. Similmente all'organizzazione del cervello, ogni chiplet esegue i propri calcoli in parallelo, i cui risultati vengono poi integrati con gli altri per raggiungere una soluzione.

Di fronte al difficile problema di separare le immagini in oltre 1,000 categorie, Taichi ha avuto successo quasi il 92% delle volte, eguagliando le prestazioni del chip attuale, ma riducendo il consumo energetico di oltre mille volte.

Per l’intelligenza artificiale, “la tendenza ad affrontare compiti più avanzati [è] irreversibile”, hanno scritto gli autori. “Taichi apre la strada al calcolo fotonico [basato sulla luce] su larga scala”, portando a un’intelligenza artificiale più flessibile con costi energetici inferiori.

Chip sulla spalla

I chip dei computer di oggi non si adattano bene all’intelligenza artificiale.

Parte del problema è strutturale. L'elaborazione e la memoria sui chip tradizionali sono fisicamente separate. Lo spostamento dei dati tra di loro richiede enormi quantità di energia e tempo.

Sebbene sia efficiente per risolvere problemi relativamente semplici, la configurazione è incredibilmente assetata di potere quando si tratta di IA complesse, come i grandi modelli linguistici che alimentano ChatGPT.

Il problema principale è come vengono costruiti i chip dei computer. Ogni calcolo si basa su transistor, che si accendono o si spengono per rappresentare gli 0 e gli 1 utilizzati nei calcoli. Nel corso dei decenni gli ingegneri hanno ridotto drasticamente i transistor in modo da poterne inserire sempre di più nei chip. Ma l'attuale tecnologia dei chip si sta avvicinando a un punto di rottura in cui non possiamo ridurci.

Gli scienziati hanno cercato a lungo di rinnovare i chip attuali. Una strategia ispirata al cervello si basa sulle “sinapsi” – il “molo” biologico che collega i neuroni – che elaborano e memorizzano le informazioni nella stessa posizione. Questi chip ispirati al cervello, o neuromorfici, riducono il consumo di energia e accelerano i calcoli. Ma come i chip attuali, fanno affidamento sull’elettricità.

Un’altra idea è quella di utilizzare un meccanismo di elaborazione completamente diverso: la luce. Il “calcolo fotonico” sta “attirando un’attenzione sempre crescente”, hanno scritto gli autori. Invece di utilizzare l’elettricità, potrebbe essere possibile dirottare le particelle di luce per alimentare l’intelligenza artificiale alla velocità della luce.

Sia la luce!

Rispetto ai chip basati sull’elettricità, la luce consuma molta meno energia e può affrontare più calcoli contemporaneamente. Sfruttando queste proprietà, gli scienziati hanno costruito reti neurali ottiche che utilizzano fotoni, particelle di luce, per i chip AI, invece dell’elettricità.

Questi chip possono funzionare in due modi. In uno, i chip diffondono i segnali luminosi in canali progettati che alla fine combinano i raggi per risolvere un problema. Chiamate diffrazione, queste reti neurali ottiche raggruppano i neuroni artificiali strettamente insieme e riducono al minimo i costi energetici. Ma non possono essere modificati facilmente, nel senso che possono funzionare solo su un singolo e semplice problema.

Una configurazione diversa dipende da un'altra proprietà della luce chiamata interferenza. Come le onde dell’oceano, le onde luminose si combinano e si annullano a vicenda. Quando si trovano all'interno di microtunnel su un chip, possono scontrarsi per potenziarsi o inibirsi a vicenda: questi schemi di interferenza possono essere utilizzati per i calcoli. I chip basati sull'interferenza possono essere facilmente riconfigurati utilizzando un dispositivo chiamato interferometro. Il problema è che sono fisicamente ingombranti e consumano tonnellate di energia.

Poi c'è il problema della precisione. Anche nei canali scolpiti spesso utilizzati per esperimenti di interferenza, la luce rimbalza e si disperde, rendendo i calcoli inaffidabili. Per una singola rete neurale ottica, gli errori sono tollerabili. Ma con reti ottiche più grandi e problemi più sofisticati, il rumore aumenta in modo esponenziale e diventa insostenibile.

Questo è il motivo per cui le reti neurali basate sulla luce non possono essere facilmente ampliate. Finora sono stati in grado di risolvere solo compiti di base, come riconoscere numeri o vocali.

“Amplificare la scala delle architetture esistenti non migliorerebbe proporzionalmente le prestazioni”, ha scritto il team.

Double Trouble

La nuova IA, Taichi, ha combinato i due tratti per spingere le reti neurali ottiche verso l’uso nel mondo reale.

Invece di configurare una singola rete neurale, il team ha utilizzato un metodo chiplet, che delegava diverse parti di un’attività a più blocchi funzionali. Ogni blocco aveva i suoi punti di forza: uno era impostato per analizzare la diffrazione, che poteva comprimere grandi quantità di dati in un breve periodo di tempo. In un altro blocco sono stati incorporati interferometri per fornire interferenze, consentendo di riconfigurare facilmente il chip tra un'attività e l'altra.

Rispetto al deep learning, Taichi ha adottato un approccio “superficiale” in cui il compito è distribuito su più chiplet.

Con le strutture standard di deep learning, gli errori tendono ad accumularsi su più livelli e nel tempo. Questa configurazione elimina sul nascere i problemi derivanti dall'elaborazione sequenziale. Di fronte a un problema, Taichi distribuisce il carico di lavoro su più cluster indipendenti, rendendo più semplice affrontare problemi più grandi con errori minimi.

La strategia ha dato i suoi frutti.

Taichi ha la capacità computazionale di 4,256 neuroni artificiali totali, con quasi 14 milioni di parametri che imitano le connessioni cerebrali che codificano l'apprendimento e la memoria. Ordinando le immagini in 1,000 categorie, il chip fotonico era accurato quasi al 92%, paragonabile alle “reti neurali elettroniche attualmente popolari”, ha scritto il team.

Il chip eccelleva anche in altri test standard di riconoscimento delle immagini AI, come l’identificazione di caratteri scritti a mano da diversi alfabeti.

Come test finale, il team ha sfidato l'intelligenza artificiale fotonica a cogliere e ricreare contenuti nello stile di diversi artisti e musicisti. Quando veniva addestrata con il repertorio di Bach, l'IA alla fine imparava l'intonazione e lo stile generale del musicista. Allo stesso modo, le immagini di Van Gogh o Edvard Munch, l’artista dietro il famoso dipinto, L'urlo-inserito nell'intelligenza artificiale le ha permesso di generare immagini in uno stile simile, anche se molte sembravano la ricreazione di un bambino.

Le reti neurali ottiche hanno ancora molta strada da fare. Ma se utilizzati su vasta scala, potrebbero rappresentare un’alternativa più efficiente dal punto di vista energetico agli attuali sistemi di intelligenza artificiale. Taichi è oltre 100 volte più efficiente dal punto di vista energetico rispetto alle iterazioni precedenti. Ma il chip richiede ancora laser per le unità di alimentazione e trasferimento dati, che sono difficili da condensare.

Successivamente, il team spera di integrare mini laser e altri componenti facilmente disponibili in un unico chip fotonico coeso. Nel frattempo, sperano che Taichi “acceleri lo sviluppo di soluzioni ottiche più potenti” che potrebbero eventualmente portare a “una nuova era” di IA potente ed efficiente dal punto di vista energetico.

Immagine di credito: spainter_vfx / Shutterstock.com

Timestamp:

Di più da Hub di singolarità