IBMs hjerneinspirerede analoge chip sigter mod at gøre AI mere bæredygtig

IBMs hjerneinspirerede analoge chip sigter mod at gøre AI mere bæredygtig

ChatGPT, DALL-E, Stabil diffusion, og andre generative AI'er har taget verden med storm. De skaber fabelagtig poesi og billeder. De siver ind i alle afkroge af vores verden, fra markedsføring til at skrive juridiske briefs og opdagelse af stoffer. De virker som plakatbarnet for en succeshistorie mellem menneske-maskine sind.

Men under motorhjelmen ser tingene mindre ferskenagtigt ud. Disse systemer er massive energisvin, der kræver datacentre, der spytter tusindvis af tons kulstofemissioner ud – hvilket yderligere understreger et allerede flygtigt klima – og suger milliarder af dollars til sig. Efterhånden som de neurale netværk bliver mere sofistikerede og mere udbredte, vil energiforbruget sandsynligvis stige endnu mere.

Der er spildt masser af blæk på generative AI'er carbonspor. Dens energiefterspørgsel kan være dens undergang, hvilket hindrer udviklingen, efterhånden som den vokser yderligere. Ved at bruge nuværende hardware forventes generativ AI at "gå snart i stå, hvis den fortsætter med at stole på standard computerhardware." sagde Dr. Hechen Wang hos Intel Labs.

Det er på høje tid, at vi bygger bæredygtig kunstig intelligens.

I denne uge, et studie fra IBM tog et praktisk skridt i den retning. De skabte en 14 nanometer analog chip pakket med 35 millioner hukommelsesenheder. I modsætning til nuværende chips, sker beregningen direkte i disse enheder, hvilket eliminerer behovet for at flytte data frem og tilbage - til gengæld sparer energi.

Data shuttling kan øge energiforbruget alt fra 3 til 10,000 gange over, hvad der kræves til den faktiske beregning, sagde Wang.

Chippen var yderst effektiv, når den blev udfordret med to talegenkendelsesopgaver. Den ene, Google Speech Commands, er lille, men praktisk. Her er hastighed nøglen. Den anden, Librispeech, er et enormt system, der hjælper med at transskribere tale til tekst, hvilket belaster chippens evne til at behandle enorme mængder data.

I modsætning til konventionelle computere udførte chippen lige så præcist, men afsluttede jobbet hurtigere og med langt mindre energi og brugte mindre end en tiendedel af, hvad der normalt kræves til nogle opgaver.

"Dette er, så vidt vi ved, de første demonstrationer af kommercielt relevante nøjagtighedsniveauer på en kommercielt relevant model ... med effektivitet og massiv parallelitet" for en analog chip, sagde teamet.

Brainy bytes

Dette er næppe den første analoge chip. Men det skubber ideen om neuromorfisk databehandling ind i det praktiske område - en chip, der en dag kan drive din telefon, dit smarte hjem og andre enheder med en effektivitet tæt på hjernen.

Øh, hvad? Lad os bakke op.

Nuværende computere er bygget på Von Neumann arkitektur. Tænk på det som et hus med flere rum. Den ene, den centrale behandlingsenhed (CPU), analyserer data. En anden gemmer hukommelse.

For hver beregning skal computeren flytte data frem og tilbage mellem de to rum, og det tager tid og energi og reducerer effektiviteten.

Hjernen derimod kombinerer både beregning og hukommelse til en studielejlighed. Dens svampelignende kryds, kaldet synapser, danner begge neurale netværk og gemmer minder på samme sted. Synapser er meget fleksible og justerer, hvor stærkt de forbinder med andre neuroner baseret på lagret hukommelse og nye erkendelser - en egenskab kaldet "vægte". Vores hjerner tilpasser sig hurtigt til et konstant skiftende miljø ved at justere disse synaptiske vægte.

IBM har været på forkant med design analoge chips der efterligner hjerneberegning. Et gennembrud kom i 2016, da de introducerede en chip baseret på et fascinerende materiale, der normalt findes i genskrivbare cd'er. Materialet ændrer sin fysiske tilstand og formskifter fra en goopy suppe til krystallignende strukturer, når det zappes med elektricitet - beslægtet med et digitalt 0 og 1.

Her er nøglen: chippen kan også eksistere i en hybrid tilstand. Med andre ord, i lighed med en biologisk synapse, kan den kunstige kode et utal af forskellige vægte – ikke kun binære – hvilket giver den mulighed for at akkumulere flere beregninger uden at skulle flytte en enkelt bit data.

Jekyll og Hyde

Den nye undersøgelse byggede på tidligere arbejde ved også at bruge faseskiftematerialer. De grundlæggende komponenter er "hukommelsesfliser." Hver er propfyldt med tusindvis af faseændringsmaterialer i en gitterstruktur. Fliserne kommunikerer let med hinanden.

Hver flise styres af en programmerbar lokal controller, der gør det muligt for teamet at finjustere komponenten – beslægtet med en neuron – med præcision. Chippen gemmer yderligere hundredvis af kommandoer i rækkefølge, hvilket skaber en sort boks, der giver dem mulighed for at grave tilbage og analysere dens ydeevne.

Samlet set indeholdt chippen 35 millioner faseændringshukommelsesstrukturer. Forbindelserne beløb sig til 45 millioner synapser - langt fra den menneskelige hjerne, men meget imponerende på en 14 nanometer chip.

IBMs hjerneinspirerede analoge chip sigter mod at gøre AI mere bæredygtig PlatoBlockchain-dataintelligens. Lodret søgning. Ai.
En 14nm analog AI-chip hviler i en forskers hånd. Billedkredit: Ryan Lavine for IBM

Disse åndssvage tal udgør et problem for initialisering af AI-chippen: der er simpelthen for mange parametre at søge igennem. Holdet tacklede problemet med, hvad der svarer til en AI-børnehave, og forprogrammerede synaptiske vægte, før beregningerne begynder. (Det er lidt ligesom at krydre en ny støbejernspande, før du laver mad med den.)

De "skræddersyede deres netværkstræningsteknikker med hardwarens fordele og begrænsninger i tankerne," og satte derefter vægtene for de mest optimale resultater, forklarede Wang, som ikke var involveret i undersøgelsen.

Det lykkedes. I en indledende test kørte chippen let gennem 12.4 billioner operationer i sekundet for hver watt strøm. Energiforbruget er "tiere eller endda hundredvis af gange højere end for de mest kraftfulde CPU'er og GPU'er," sagde Wang.

Chippen stiftede en kerneberegningsproces, der ligger til grund for dybe neurale netværk med blot nogle få klassiske hardwarekomponenter i hukommelsesfelterne. I modsætning hertil har traditionelle computere brug for hundredvis eller tusindvis af transistorer (en grundlæggende enhed, der udfører beregninger).

Talk of the Town

Holdet udfordrede derefter chippen til to talegenkendelsesopgaver. Hver enkelt understregede en anden facet af chippen.

Den første test var hastighed, når den blev udfordret med en relativt lille database. Bruger Google talekommandoer database, krævede opgaven, at AI-chippen kunne se 12 nøgleord i et sæt på omkring 65,000 klip af tusindvis af mennesker, der talte 30 korte ord ("lille" er relativt i deep learning-universet). Når du bruger et accepteret benchmark—MLPerf— chippen klarede sig syv gange hurtigere end i tidligere arbejde.

Chippen skinnede også, når den blev udfordret med en stor database, Libritale. Korpuset indeholder over 1,000 timers læst engelsk tale, der almindeligvis bruges til at træne AI til at analysere tale og automatisk tale-til-tekst-transskription.

Samlet set brugte holdet fem chips til til sidst at kode mere end 45 millioner vægte ved hjælp af data fra 140 millioner faseskiftenheder. I forhold til konventionel hardware var chippen omkring 14 gange mere energieffektiv - behandlede næsten 550 prøver hvert sekund pr. watt energiforbrug - med en fejlrate lidt over 9 procent.

Selvom det er imponerende, er analoge chips stadig i deres vorden. De viser "enormt løfte om at bekæmpe bæredygtighedsproblemerne forbundet med AI," sagde Wang, men vejen frem kræver at rydde et par flere forhindringer.

En faktor er finpudsning af designet af selve hukommelsesteknologien og dens omgivende komponenter - det vil sige hvordan chippen er lagt ud. IBMs nye chip indeholder endnu ikke alle de nødvendige elementer. Et næste kritiske skridt er at integrere alt på en enkelt chip, samtidig med at dets effektivitet bevares.

På softwaresiden har vi også brug for algoritmer, der specifikt er skræddersyet til analoge chips, og software, der let oversætter kode til sprog, som maskiner kan forstå. Efterhånden som disse chips bliver mere og mere kommercielt levedygtige, vil udvikling af dedikerede applikationer holde drømmen om en fremtidig analog chip i live.

"Det tog årtier at forme de beregningsmæssige økosystemer, hvor CPU'er og GPU'er fungerer så vellykket," sagde Wang. "Og det vil sandsynligvis tage år at etablere den samme slags miljø for analog AI."

Billede Credit: Ryan Lavine for IBM

Tidsstempel:

Mere fra Singularitet Hub