IBM-ov analogni čip, ki ga navdihuje možgane, želi narediti umetno inteligenco bolj trajnostno

IBM-ov analogni čip, ki ga navdihuje možgane, želi narediti umetno inteligenco bolj trajnostno

ChatGPT, DALL-E, Stabilna difuzija, in druge generativne umetne inteligence so prevzele svet. Ustvarjajo čudovito poezijo in slike. Pronicajo v vsak kotiček našega sveta, od trženja do pisanja pravnih dokumentov in odkrivanja zdravil. Zdijo se kot poster za zgodbo o uspehu zlivanja uma človek-stroj.

Toda pod pokrovom so stvari videti manj grozljive. Ti sistemi so ogromni porabniki energije, ki zahtevajo podatkovne centre, ki oddajajo na tisoče ton emisij ogljika – kar dodatno poudarja že tako nestanovitno podnebje – in posrkajo milijarde dolarjev. Ko bodo nevronske mreže postale bolj izpopolnjene in bolj razširjene, bo poraba energije verjetno še bolj narasla.

O generativni AI je bilo prelitega veliko črnila ogljični odtis. Njegovo povpraševanje po energiji bi lahko pomenilo njegov propad in oviralo razvoj, ko bo še naprej rasel. Z uporabo trenutne strojne opreme naj bi generativni AI "kmalu zastal, če se bo še naprej zanašal na standardno računalniško strojno opremo," je dejal Hechen Wang iz Intel Labs.

Skrajni čas je, da zgradimo trajnostno umetno inteligenco.

Ta teden, študija iz IBM je naredil praktičen korak v to smer. Ustvarili so 14-nanometrski analogni čip s 35 milijoni pomnilniških enot. V nasprotju s sedanjimi čipi se računanje izvaja neposredno znotraj teh enot, s čimer ni potrebe po premikanju podatkov sem in tja – kar prihrani energijo.

Premikanje podatkov lahko poveča porabo energije od 3- do 10,000-krat več, kot je potrebno za dejanski izračun, je dejal Wang.

Čip je bil zelo učinkovit pri dveh nalogah prepoznavanja govora. Prvi, Google Speech Commands, je majhen, a praktičen. Tukaj je ključna hitrost. Drugi, Librispeech, je mamutski sistem, ki pomaga pri prepisovanju govora v besedilo in obdavči sposobnost čipa za obdelavo ogromnih količin podatkov.

V primerjavi z običajnimi računalniki je čip deloval enako natančno, vendar je opravil delo hitreje in z veliko manj energije, pri čemer je porabil manj kot desetino tistega, kar je običajno potrebno za nekatera opravila.

"Kolikor nam je znano, so to prve predstavitve komercialno pomembnih stopenj natančnosti na komercialno pomembnem modelu ... z učinkovitostjo in ogromnim paralelizmom" za analogni čip, je dejala ekipa.

Brainy Bytes

To ni prvi analogni čip. Vendar potisne idejo nevromorfnega računalništva v sfero praktičnosti – čip, ki bi lahko nekega dne poganjal vaš telefon, pametni dom in druge naprave z učinkovitostjo, ki je blizu učinkovitosti možganov.

Hm, kaj? Pojdimo nazaj.

Trenutni računalniki so zgrajeni na Von Neumannova arhitektura. Predstavljajte si to kot hišo z več sobami. Ena, centralna procesna enota (CPE), analizira podatke. Drugi shranjuje pomnilnik.

Za vsak izračun mora računalnik prenašati podatke naprej in nazaj med tema sobama, kar zahteva čas in energijo ter zmanjšuje učinkovitost.

Nasprotno pa možgani združujejo tako računanje kot spomin v garsonjero. Njena gobam podobna stičišča, imenovana sinapse, tvorijo nevronske mreže in shranjujejo spomine na istem mestu. Sinapse so zelo prilagodljive in prilagajajo, kako močno se povezujejo z drugimi nevroni na podlagi shranjenega spomina in novih spoznanj – lastnost, imenovana »uteži«. Naši možgani se s prilagajanjem teh sinaptičnih uteži hitro prilagajajo okolju, ki se nenehno spreminja.

IBM je bil v ospredju oblikovanja analogni čipi ta mimik možgansko računanje. Preboj prišel v 2016, ko so predstavili čip, ki temelji na fascinantnem materialu, ki ga običajno najdemo na prepisljivih CD-jih. Material spremeni svoje fizikalno stanje in obliko prestavi iz gobjaste juhe v kristalno podobne strukture, ko ga prevzame elektrika – podobno kot digitalni 0 in 1.

Tukaj je ključ: čip lahko obstaja tudi v hibridnem stanju. Z drugimi besedami, podobno kot biološka sinapsa lahko umetna sinapsa kodira nešteto različnih uteži – ne le binarnih –, kar ji omogoča kopičenje več izračunov, ne da bi bilo treba premakniti en sam bit podatkov.

Jekyll in Hyde

Nova študija je temeljila na prejšnjem delu z uporabo materialov s fazno spremembo. Osnovne komponente so »pomnilniške ploščice«. Vsak je poln na tisoče fazno spremenljivih materialov v mrežni strukturi. Ploščice zlahka komunicirajo med seboj.

Vsako ploščico nadzira lokalni krmilnik, ki ga je mogoče programirati, kar ekipi omogoča natančno prilagajanje komponente – podobno kot nevron. Čip nadalje shranjuje na stotine ukazov v zaporedju in ustvarja nekakšno črno skrinjico, ki jim omogoča, da se poglobijo in analizirajo njegovo delovanje.

Na splošno je čip vseboval 35 milijonov fazno spremenljivih pomnilniških struktur. Povezave so obsegale 45 milijonov sinaps – daleč od človeških možganov, a zelo impresivno na 14-nanometrskem čipu.

IBM’s Brain-Inspired Analog Chip Aims to Make AI More Sustainable PlatoBlockchain Data Intelligence. Vertical Search. Ai.
14nm analogni čip AI, ki počiva v roki raziskovalca. Avtorstvo slike: Ryan Lavine za IBM

Te osupljive številke predstavljajo težavo pri inicializaciji čipa umetne inteligence: enostavno je preveč parametrov, ki jih je treba iskati. Ekipa se je lotila problema s tem, kar pomeni vrtec z umetno inteligenco, s predprogramiranjem sinaptičnih uteži, preden se začnejo izračuni. (To je podobno, kot bi začinili novo litoželezno ponev, preden bi z njo kuhali.)

"Prilagodili so svoje tehnike omrežnega usposabljanja z upoštevanjem prednosti in omejitev strojne opreme" in nato določili uteži za najbolj optimalne rezultate, je pojasnil Wang, ki ni bil vključen v študijo.

Uspelo je. V enem od začetnih preizkusov je čip z lahkoto pregnal 12.4 bilijona operacij na sekundo za vsak vat moči. Poraba energije je "deset ali celo stokrat višja kot pri najmočnejših procesorjih in grafičnih procesorjih," je dejal Wang.

Čip je s samo nekaj klasičnimi komponentami strojne opreme v pomnilniških ploščicah zakoličil osrednji računalniški proces, ki je podlaga za globoke nevronske mreže. Nasprotno pa tradicionalni računalniki potrebujejo na stotine ali tisoče tranzistorjev (osnovna enota, ki izvaja izračune).

Pogovor o kraju

Ekipa je nato izzvala čip na dve nalogi prepoznavanja govora. Vsak je poudaril drugačno plat čipa.

Prvi preizkus je bila hitrost, ko smo jo izpodbijali z relativno majhno zbirko podatkov. Uporabljati Googlovi govorni ukazi baze podatkov je naloga zahtevala, da čip AI zazna 12 ključnih besed v nizu približno 65,000 posnetkov na tisoče ljudi, ki govorijo 30 kratkih besed ("majhno" je relativno v vesolju globokega učenja). Pri uporabi sprejetega merila uspešnosti—MLPerf— čip je deloval sedemkrat hitreje kot v prejšnjem delu.

Čip je blestel tudi pri izzivu z veliko bazo podatkov, Librigovor. Korpus vsebuje več kot 1,000 ur prebranega angleškega govora, ki se običajno uporablja za usposabljanje AI za razčlenjevanje govora in samodejno prepisovanje govora v besedilo.

Na splošno je ekipa uporabila pet čipov za kodiranje več kot 45 milijonov uteži z uporabo podatkov iz 140 milijonov naprav za spreminjanje faze. V primerjavi s konvencionalno strojno opremo je bil čip približno 14-krat bolj energetsko učinkovit - obdelal je skoraj 550 vzorcev vsako sekundo na vat porabe energije - s stopnjo napak nekaj več kot 9 odstotkov.

Čeprav impresivni, so analogni čipi še vedno v povojih. Kažejo "ogromno obljubo za boj proti trajnostnim težavam, povezanim z umetno inteligenco," je dejal Wang, vendar pot naprej zahteva premagovanje še nekaj ovir.

Eden od dejavnikov je izboljšanje zasnove same pomnilniške tehnologije in njenih okoliških komponent – ​​to je, kako je čip postavljen. IBM-ov novi čip še ne vsebuje vseh potrebnih elementov. Naslednji kritični korak je integracija vsega v en sam čip ob ohranjanju njegove učinkovitosti.

Na strani programske opreme bomo potrebovali tudi algoritme, ki so posebej prilagojeni analognim čipom, in programsko opremo, ki zlahka prevede kodo v jezik, ki ga lahko stroji razumejo. Ker postajajo ti čipi vse bolj komercialno uspešni, bo razvoj namenskih aplikacij ohranil sanje o prihodnosti analognih čipov žive.

»Desetletja so bila potrebna za oblikovanje računalniških ekosistemov, v katerih CPE in GPE delujejo tako uspešno,« je dejal Wang. "In verjetno bodo trajala leta, da se vzpostavi enako okolje za analogno umetno inteligenco."

Kreditno slike: Ryan Lavine za IBM

Časovni žig:

Več od Središče singularnosti