Mis on GPU? Tehisintellekti buumi toidavad kiibid ja miks need on väärt triljoneid

Mis on GPU? Tehisintellekti buumi toidavad kiibid ja miks need on väärt triljoneid

What Is a GPU? The Chips Powering the AI Boom, and Why They’re Worth Trillions PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Kuna maailm tormab AI-tehnoloogiate uusimat lainet kasutama, on ühest kõrgtehnoloogilisest riistvarast saanud üllatavalt kuum kaup: graafikaprotsessor ehk GPU.

Tipptasemel GPU saab müüa kümneid tuhandeid dollareid, ja juhtiv tootja Nvidia on näinud oma turuväärtust tõusta üle 2 triljoni dollari kui nõudlus tema toodete järele kasvab.

GPU-d pole ka ainult tipptasemel AI-tooted. Telefonides, sülearvutites ja mängukonsoolides on ka vähem võimsaid GPU-sid.

Nüüdseks olete ilmselt mõelnud: mis on GPU tegelikult? Ja mis teeb nad nii eriliseks?

Mis on GPU?

GPU-d olid algselt loodud peamiselt keerukate 3D-stseenide ja -objektide kiireks genereerimiseks ja kuvamiseks, näiteks need, mis on seotud videomängude ja arvutipõhine disain tarkvara. Kaasaegsed GPU-d saavad hakkama ka selliste ülesannetega nagu dekompressioon videovoogusid.

Enamiku arvutite "aju" on kiip, mida nimetatakse keskprotsessoriks (CPU). Protsessoreid saab kasutada graafiliste stseenide genereerimiseks ja videote lahtipakkimiseks, kuid tavaliselt on need GPU-dega võrreldes palju aeglasemad ja vähem tõhusad. Protsessorid sobivad paremini üldiste arvutusülesannete jaoks, nagu tekstitöötlus ja veebilehtede sirvimine.

Kuidas GPU-d CPU-dest erinevad?

Tüüpiline kaasaegne protsessor koosneb 8–16-tollisestsüdamikud”, millest igaüks saab keerukaid ülesandeid järjestikku töödelda.

GPU-del on seevastu tuhandeid suhteliselt väikeseid südamikke, mis on loodud töötama kõik üheaegselt (“paralleelselt”), et saavutada kiire üldine töötlemine. See muudab need hästi sobivateks ülesanneteks, mis nõuavad palju lihtsaid toiminguid, mida saab teha korraga, mitte üksteise järel.

Traditsioonilistel GPU-del on kaks peamist maitset.

Esiteks on olemas eraldiseisvad kiibid, mis on sageli suurte lauaarvutite jaoks mõeldud lisakaartidena. Teiseks on GPU-d kombineeritud protsessoriga samas kiibipaketis, mida leidub sageli sülearvutites ja mängukonsoolides, nagu PlayStation 5. Mõlemal juhul juhib CPU GPU tegevust.

Miks on GPU-d AI jaoks nii kasulikud?

Selgub, et GPU-sid saab kasutada enamaks kui graafiliste stseenide genereerimiseks.

Paljud masinõppe tehnikad on taga tehisintellektiNagu sügavad närvivõrgud, toetuvad suuresti maatriksi korrutamise erinevatele vormidele.

See on matemaatiline tehe, kus korrutatakse ja liidetakse kokku väga suured arvude komplektid. Need toimingud sobivad hästi paralleelseks töötlemiseks ja seetõttu saavad GPU-d neid väga kiiresti teha.

Mis saab GPU-dest edasi?

Graafikaprotsessorite arvukuse määramise võime kasvab pidevalt tänu tuumade arvu ja nende töökiiruste suurenemisele. Need täiustused on peamiselt tingitud kiibi tootmise täiustustest sellistes ettevõtetes nagu TSMC Taiwanis.

Üksikute transistoride – mis tahes arvutikiibi põhikomponentide – suurus väheneb, võimaldades samasse füüsilisse ruumi paigutada rohkem transistore.

See pole aga kogu lugu. Kuigi traditsioonilised GPU-d on tehisintellektiga seotud arvutusülesannete jaoks kasulikud, pole need optimaalsed.

Nii nagu GPU-d loodi algselt arvutite kiirendamiseks, pakkudes graafika spetsiaalset töötlemist, on ka kiirendeid, mis on loodud masinõppe ülesannete kiirendamiseks. Neid kiirendeid nimetatakse sageli andmekeskuse GPU-deks.

Mõned populaarseimad kiirendid, mida valmistasid sellised ettevõtted nagu AMD ja Nvidia, said alguse traditsioonilistest GPU-dest. Aja jooksul arenesid nende disainid erinevate masinõppeülesannetega paremini toimetulekuks, näiteks toetades tõhusamaid "aju ujuv” numbrivormingus.

Muud kiirendid, näiteks Google'i oma tensori töötlemisüksused ja Tenstorrent Tensix südamikud, olid loodud algusest peale sügavate närvivõrkude kiirendamiseks.

Andmekeskuse GPU-d ja muud AI-kiirendid on tavaliselt varustatud oluliselt rohkem mäluga kui traditsioonilised GPU-lisandkaardid, mis on suurte AI-mudelite treenimisel ülioluline. Mida suurem on AI mudel, seda võimekam ja täpsem see on.

Treenimise kiirendamiseks ja veelgi suuremate tehisintellekti mudelite (nt ChatGPT) käsitlemiseks saab paljud andmekeskuse GPU-d ühendada superarvutiks. Selleks on vaja keerukamat tarkvara, et kasutada saadaolevat numbrit murdvat jõudu. Teine lähenemine on luua üks väga suur kiirendi, nagu "vahvli skaala protsessor” tootja Cerebras.

Kas spetsialiseeritud kiibid on tulevik?

Ka protsessorid pole paigal seisnud. AMD ja Inteli viimastel protsessoritel on sisseehitatud madala taseme juhised, mis kiirendavad sügavate närvivõrkude jaoks vajalikku numbrite otsimist. See lisafunktsioon aitab peamiselt „järeldusülesannete tegemisel”, st kasutades AI mudeleid, mis on juba mujal välja töötatud.

AI mudelite esmaseks koolitamiseks on endiselt vaja suuri GPU-laadseid kiirendeid.

Konkreetsete masinõppealgoritmide jaoks on võimalik luua üha rohkem spetsiaalseid kiirendeid. Hiljuti on näiteks ettevõte nimega Groq tootnud „keeletöötlusüksus” (LPU), mis on spetsiaalselt loodud suurte keelemudelite käitamiseks ChatGPT eeskujul.

Nende spetsiaalsete protsessorite loomine nõuab aga märkimisväärseid inseneriressursse. Ajalugu näitab, et iga antud masinõppealgoritmi kasutus ja populaarsus kipuvad saavutama haripunkti ja seejärel vähenema – nii et kallis spetsiaalne riistvara võib kiiresti vananeda.

Tavatarbija jaoks pole see aga tõenäoliselt probleem. Teie kasutatavates toodetes olevad GPU-d ja muud kiibid muutuvad tõenäoliselt vaikselt kiiremaks.

See artikkel avaldatakse uuesti Vestlus Creative Commonsi litsentsi all. Loe algse artikli.

Image Credit: Nvidia

Ajatempel:

Veel alates Singulaarsuse keskus