Cipul analogic inspirat de creierul IBM își propune să facă AI mai sustenabilă

Cipul analogic inspirat de creierul IBM își propune să facă AI mai sustenabilă

Chat GPT, DALĂ, Difuzie stabilă, și alte IA generative au luat lumea cu asalt. Ei creează poezie și imagini fabuloase. Se infiltrează în fiecare colț al lumii noastre, de la marketing la scrierea de briefs juridice și descoperirea de droguri. Ei par afișul unei povești de succes cu o minte om-mașină.

Dar sub capotă, lucrurile arată mai puțin de piersici. Aceste sisteme sunt niște porci de energie masivă, care necesită centre de date care scuipă mii de tone de emisii de carbon - subliniind și mai mult un climat deja volatil - și absorb miliarde de dolari. Pe măsură ce rețelele neuronale devin mai sofisticate și mai utilizate pe scară largă, consumul de energie este probabil să crească și mai mult.

S-a vărsat multă cerneală pe AI-urile generative amprenta de carbon. Cererea sa de energie ar putea fi căderea ei, împiedicând dezvoltarea pe măsură ce crește în continuare. Folosind hardware-ul actual, IA generativă este „de așteptat să se blocheze în curând dacă va continua să se bazeze pe hardware-ul de calcul standard”. a spus Dr. Hechen Wang la Intel Labs.

Este timpul să construim IA durabilă.

În această săptămână, un studiu de la IBM a făcut un pas practic în această direcție. Ei au creat un cip analogic de 14 nanometri cu 35 de milioane de unități de memorie. Spre deosebire de cipurile actuale, calculul are loc direct în acele unități, eliminând nevoia de a transfera datele înainte și înapoi, economisind la rândul său energie.

Transferul de date poate crește consumul de energie oriunde de la 3 la 10,000 de ori peste ceea ce este necesar pentru calculul real, a spus Wang.

Cipul a fost foarte eficient atunci când a fost provocat cu două sarcini de recunoaștere a vorbirii. Una, Google Speech Commands, este mică, dar practică. Aici, viteza este cheia. Celălalt, Librispeech, este un sistem uriaș care ajută la transcrierea vorbirii în text, taxând capacitatea cipului de a procesa cantități masive de date.

Când este pus în comparație cu computerele convenționale, cipul a funcționat la fel de precis, dar a terminat treaba mai rapid și cu mult mai puțină energie, folosind mai puțin de o zecime din ceea ce este necesar în mod normal pentru unele sarcini.

„Acestea sunt, după cunoștințele noastre, primele demonstrații ale nivelurilor de acuratețe relevante din punct de vedere comercial pe un model relevant din punct de vedere comercial... cu eficiență și paralelism masiv” pentru un cip analog, a spus echipa.

Brainy Bytes

Acesta nu este primul cip analogic. Cu toate acestea, împinge ideea de calcul neuromorf în domeniul practic - un cip care ar putea într-o zi să alimenteze telefonul, casa inteligentă și alte dispozitive cu o eficiență apropiată de cea a creierului.

Ce? Să ne întoarcem.

Calculatoarele actuale sunt construite pe Arhitectura Von Neumann. Gândiți-vă la ea ca la o casă cu mai multe camere. Unul, unitatea centrală de procesare (CPU), analizează datele. Un altul stochează memoria.

Pentru fiecare calcul, computerul trebuie să transfere datele înainte și înapoi între cele două camere și necesită timp și energie și scade eficiența.

Creierul, în schimb, combină atât calculul, cât și memoria într-o garsonieră. Joncțiunile sale asemănătoare ciupercilor, numite sinapse, formează ambele rețele neuronale și stochează amintiri în aceeași locație. Sinapsele sunt extrem de flexibile, ajustând cât de puternic se conectează cu alți neuroni pe baza memoriei stocate și a noilor învățături - o proprietate numită „greutăți”. Creierul nostru se adaptează rapid la un mediu în continuă schimbare prin ajustarea acestor greutăți sinaptice.

IBM a fost în fruntea proiectării cipuri analogice care imita calculul creierului. O descoperire a venit in 2016, când au introdus un cip bazat pe un material fascinant care se găsește de obicei în CD-urile reinscriptibile. Materialul își schimbă starea fizică și se schimbă de formă de la o supă gluoasă la structuri asemănătoare cristalului atunci când este zăpăcit cu electricitate - asemănător cu un 0 și 1 digital.

Iată cheia: cipul poate exista și în stare hibridă. Cu alte cuvinte, similar unei sinapse biologice, cea artificială poate codifica o multitudine de greutăți diferite - nu doar binare - permițându-i să acumuleze mai multe calcule fără a fi nevoie să mute un singur bit de date.

Jekyll și Hyde

Noul studiu s-a bazat pe lucrările anterioare utilizând și materiale cu schimbare de fază. Componentele de bază sunt „plăci de memorie”. Fiecare este plin de mii de materiale cu schimbare de fază într-o structură de grilă. Placile comunică ușor între ele.

Fiecare placă este controlată de un controler local programabil, permițând echipei să modifice componenta - asemănătoare cu un neuron - cu precizie. Cipul stochează în continuare sute de comenzi în secvență, creând un fel de cutie neagră care le permite să analizeze performanța acesteia.

În total, cipul conținea 35 de milioane de structuri de memorie cu schimbare de fază. Conexiunile s-au ridicat la 45 de milioane de sinapse - foarte departe de creierul uman, dar foarte impresionant pe un cip de 14 nanometri.

IBM’s Brain-Inspired Analog Chip Aims to Make AI More Sustainable PlatoBlockchain Data Intelligence. Vertical Search. Ai.
Un cip AI analogic de 14 nm care se sprijină în mâna unui cercetător. Credit imagine: Ryan Lavine pentru IBM

Aceste numere tulburătoare prezintă o problemă pentru inițializarea cipului AI: pur și simplu sunt prea mulți parametri de căutat. Echipa a abordat problema cu ceea ce înseamnă o grădiniță AI, preprogramarea greutăților sinaptice înainte de a începe calculele. (Este un pic ca și cum ai condimenta o nouă tigaie din fontă înainte de a găti cu ea.)

Ei „și-au adaptat tehnicile de formare în rețea ținând cont de beneficiile și limitările hardware-ului”, apoi au stabilit ponderile pentru cele mai optime rezultate, a explicat Wang, care nu a fost implicat în studiu.

A mers. Într-un test inițial, cipul a trecut cu ușurință prin 12.4 trilioane de operațiuni pe secundă pentru fiecare watt de putere. Consumul de energie este „de zeci sau chiar de sute de ori mai mare decât pentru cele mai puternice procesoare și GPU”, a spus Wang.

Cipul a realizat un proces de calcul de bază care stă la baza rețelelor neuronale profunde cu doar câteva componente hardware clasice în plăcile de memorie. În schimb, calculatoarele tradiționale au nevoie de sute sau mii de tranzistori (o unitate de bază care efectuează calcule).

Gura lumii

Apoi, echipa a provocat cipul la două sarcini de recunoaștere a vorbirii. Fiecare a subliniat o fațetă diferită a cipului.

Primul test a fost viteza atunci când a fost provocat cu o bază de date relativ mică. Folosind Comenzi Google Speech baza de date, sarcina a cerut ca cipul AI să identifice 12 cuvinte cheie într-un set de aproximativ 65,000 de clipuri de mii de oameni care rostesc 30 de cuvinte scurte („mic” este relativ în universul de învățare profundă). Când utilizați un benchmark acceptat—MLPerf— cipul a funcționat de șapte ori mai repede decât în ​​lucrările anterioare.

Cipul a strălucit și atunci când a fost provocat cu o bază de date mare, Librispeech. Corpusul conține peste 1,000 de ore de vorbire citită în limba engleză folosită în mod obișnuit pentru a antrena AI pentru analizarea vorbirii și transcrierea automată a vorbirii în text.

În general, echipa a folosit cinci cipuri pentru a codifica în cele din urmă peste 45 de milioane de greutăți folosind date de la 140 de milioane de dispozitive cu schimbare de fază. În comparație cu hardware-ul convențional, cipul a fost de aproximativ 14 ori mai eficient din punct de vedere energetic - procesând aproape 550 de mostre în fiecare secundă pe watt de consum de energie - cu o rată de eroare de puțin peste 9%.

Deși sunt impresionante, cipurile analogice sunt încă la început. Ei arată „promisiune enormă pentru combaterea problemelor de durabilitate asociate cu IA”, a spus Wang, dar calea de urmat necesită depășirea altor câteva obstacole.

Un factor este îmbunătățirea designului tehnologiei de memorie în sine și a componentelor ei înconjurătoare, adică modul în care este așezat cipul. Noul cip al IBM nu conține încă toate elementele necesare. Un următor pas critic este integrarea totul pe un singur cip, menținându-i în același timp eficacitatea.

În ceea ce privește software-ul, vom avea nevoie, de asemenea, de algoritmi care să se adapteze în mod special la cipurile analogice și de software care să traducă cu ușurință codul într-un limbaj pe care mașinile îl pot înțelege. Pe măsură ce aceste cipuri devin din ce în ce mai viabile din punct de vedere comercial, dezvoltarea de aplicații dedicate va menține viu visul unui viitor cip analogic.

„A fost nevoie de zeci de ani pentru a modela ecosistemele de calcul în care CPU-urile și GPU-urile funcționează cu atâta succes”, a spus Wang. „Și probabil că va dura ani pentru a stabili același tip de mediu pentru IA analogică.”

Credit imagine: Ryan Lavine pentru IBM

Timestamp-ul:

Mai mult de la Singularity Hub