Protsessori roll jätkusuutlikus AI/ML-is

Taasavaldanud Platon

järgijaid: 0

Protsessori roll jätkusuutlikus AI/ML PlatoBlockchain andmeluures. Vertikaalne otsing. Ai.

Reklaam Kuna tehisintellekt laiendab oma haaret üle ettevõtete arvutuskeskkondade, põhjustab selle mõju mõningaid ootamatuid kõrvalmõjusid. IDC uusim FutureScape Näiteks ennustab aruanne, et kuna ettevõtted võistlevad tehisintellektiga täiustatud toodete/teenuste kasutuselevõtu ja klientide abistamise nimel tehisintellekti juurutamisel, muutub tehnoloogia innovatsiooni peamiseks motivaatoriks.

Teine AI-põhine muudatus keskendub sellele, mil määral andmekeskused peavad tasakaalustama protsessoreid diskreetsete tehisintellekti kiirenditega, nagu GPU-d või spetsiaalsed arhitektuurid, et pakkuda tehisintellekti arendajatele soovitud suure jõudlusega arvutusvõimalusi.

See on arutelu, mis tõstatab andmekeskuste omanike jaoks suuri probleeme nii täiendavate CAPEX-investeeringute kui ka tõenäosuse osas, et (kuigi mõõtmismeetodid on ebatäpsed) tüüpilised GPU-põhised AI-toimingud tarbivad rohkem energiat kui tavalised IT-töökoormused.

Tehisintellekti suurema võimsuse/süsiniku üldkuludega tegelemine on andmekeskuse toimingute jaoks täiendav valupunkt, mis peab samuti tagama, et tehisintellekti jaoks optimeeritud täiustatud arvutusarhitektuurid suudavad hallata suurenenud energiavajadust, ilma et oleks oht olemasolevat tehnoloogiat või rajatisi üle koormata.

Kuna säästva juhtimise ja süsinikdioksiidi haldamise laiendatud reguleerimine sunnib energiakasutust vähendama kogu IT riist- ja tarkvara ulatuses, on tehisintellekt nii võimalus kui ka takistus.

AI energiatarbimise vähendamine

Kokkuvõttes on suurenenud energiatarve ja vajalikud arhitektuursed ümberseadistamised, mis on vajalikud tehisintellekti ja masinõppe töökoormuse jaoks, andmekeskuste jaoks ületamatu väljakutse, selgitab Inteli AI tippkeskuse tehisintellekti GTM-i direktor Stephan Gillich.

"On üsna selge vertikaalsetes sektorites ja tööstusharudes, kus iganes tehisintellekti/masinõppe rakendusi ja teenuseid arendatakse, koolitatakse ja käitatakse, et kohapealsete ja pilvehostitavate IT-rajatiste võimeid tuleb uuendada, et tulla toime suurenenud andmemahuga. -intensiivne töökoormus, ”ütleb Gillich. "Samuti on selge, et need uuendused peavad hõlmama enamat kui lihtsalt arvutusvõime suurendamist."

AI-le keskendunud andmekeskuste jätkusuutlikkuse suurendamiseks saab palju ära teha, usub Gillich, alustades tehisintellekti/masinõppe maastikuga seotud eelduste ümberhindamisest. Töötlemisüksused on hea koht alustamiseks, eriti kui otsustate, kas protsessorid või GPU-d sobivad ülesandega paremini.

Kuna kuigi tehisintellektiga seotud arvutusmahukas töökoormus näib olevat tõusuteel (keegi pole päris kindel, millises tempos), peab suurem osa andmekeskuse tööst (mitte-AI töökoormus) jätkuma päevast päeva, pakkudes püsivat rakendust. ja teenuse tuluvooge ei tohi häirida.

Enamikku neist haldavad praegu protsessorid ja standardse andmekeskuse ümberehitamine kulukamate graafikaprotsessoritega oleks paljude rajatiste jaoks nõuetest üleliigne. Üldiselt tarbib GPU sarnase ülesande täitmiseks rohkem võimsust kui CPU. Sõltuvalt konkreetse racki konfiguratsiooni toiteallikast nõuab GPU-de integreerimine andmekeskuse infrastruktuuri näiteks toitejaotussüsteemide uuendamist, millega kaasnevad lisaks suurematele energiaarvetele, kui need tööle hakkavad.

Veelgi enam, Inteli protsessori arendus jätkab uuendusi. Gillich väidab, et mitmel kasutusel on protsessor saavutanud sama hea – ja mõnikord parema – üldise jõudluse kui GPU. Ja nende jõudlust saab täiendada läbimurdeliste tehnoloogiatega, nagu Intel® AMX (Advanced Matrix Extensions), mis on neljanda põlvkonna Intel Xeoni protsessoritesse sisseehitatud kiirendi.

"Intel Xeoni protsessorid võimaldavad andmekeskusel oma tehisintellekti kasutuselevõttu skaleerida sisseehitatud AI kiirenduse abil, mis suurendab protsessori jõudlust masinõppe, koolituse ja järelduste tegemiseks," juhib Gillich tähelepanu. "Nii saavad nad kasutusele võtta diskreetsed kiirendid, et minimeerida CAPEX-i ja maksimeerida jõudlust, kasutades samal ajal olemasolevaid Intel Xeoni töötlemiskeskkondi."

Peab segama tehisintellekti ja mitte-AI töökoormust

Intel AMX on Intel Xeoni skaleeritava protsessori tuuma spetsiaalne riistvaraplokk, mis võimaldab tehisintellekti töökoormust töötada CPU-s, selle asemel et laadida need diskreetsele kiirendile, pakkudes märkimisväärset jõudlust. See sobib maatriksmatemaatikale tuginevate tehisintellekti töökoormustega, nagu masinõppe soovitussüsteemid, pildituvastus ja loomuliku keele töötlemine.

Teine argument laiendatud protsessorite kasuks on see, et need pakuvad andmekeskuste operaatoritele kulutõhusat teed olemasolevate CPU-kohustuste täitmiseks, oma varade tulevikukindlaks muutmiseks, et nad saaksid vastu võtta erinevat töökoormust ja asetada need paremasse olukorda. kontrollida üldist energiatarbimist.

See võib omakorda aidata andmekeskuse teenuste pakkujatel (ja nende klientidel) saavutada jätkusuutlikkuseesmärke ning pakkuda müügiargumenti tarkvaraarendajatele (ettevõtetele või kolmandatele osapooltele), kes otsivad optimeeritud platvormi oma kodeerimise energiatõhususe tutvustamiseks. väljundid.

„Tegelikkus on see, et tehisintellekti töökoormusega kaasnevate võimalustega kiirustamise asemel mõistavad andmekeskuste operaatorid, et nad peaksid arvestama mitmete kohustustega, mis lähtuvad nii ärilistest kui ka tehnoloogilistest valikutest,“ ütleb Gillich.

Need nõuded võivad hõlmata järgmist: tehisintellekti töökoormuste integreerimine mitte-AI töökoormustega; erinevate riist- ja tarkvarapakkide integreerimine; ja kuna nad tahavad tagada, et neil on arhitektuur, mis sobib mitme erineva töökoormuse jaoks, integreerida erinevaid töövootüüpe.

"Need küsimused viitavad keerulistele väljakutsetele, sest nende õige lahendamine mõjutab optimaalset tehnoloogilist ja energiatõhusust – energiatõhusus on nüüdseks põhiline jõudluse etalon, mis mõjutab üha enam andmekeskuse ärilist elujõulisust," ütleb Gillich. "Seega on see taas ülimalt tähtis."

Gillichi vaatenurgast on selle esilekerkiva reaalsusega kohanemise võti astmeline protsess, mida võib nimetada tehisintellekti assimilatsiooniks. Esimene punkt on see, et tehisintellekti töökoormusi ei eraldata muudest töökoormuse tüüpidest – need integreeritakse tavapärastesse töökoormustesse, mitte ei käitata eraldi.

Gillich toob selle etapiviisilise integreerimise näitena videokonverentsi: „Juba standardsete heli-/videoliikluse voogesituse ajal standardsete rakenduste vahel on AI integreeritud, et täita kaasnevaid ülesandeid, nagu kokkuvõte, tõlkimine, transkriptsioon. AI toetab selliseid funktsioone väga hästi.

Täielik energiasääst

Gillich väidab, et energiatõhususe saavutamine peab olema tõeliselt läbiv strateegiline ettevõtmine. „See hõlmab nii tarkvara poolt kui ka riistvaraarhitektuure – täielikku mehhanismi, mis võimaldab antud töövoo protsessi. Kuhu salvestatakse andmeid, et juurdepääs oleks kõige tõhusam – arvutustark ja seega ka energiatõhus – kas see on parim koht energiatõhususe tagamiseks?

Teine tegur, mida sellesse hindamisse kaasata, on töökoormuse määramine. Kas see töötab näiteks klientidel (nt Intel Core Ultra protsessoritega AI-arvutitel, mitte andmekeskuse serveritel? Kas mõnda neist tehisintellekti töökoormustest saab tegelikult käivitada ka klientidel (kõrvuti serveritega)?

Iga variant on kaalumist väärt, kui see aitab AI-arvutuse ja energiatarbimise tasakaalu paremini ühtlustada, väidab Gillich: "See on peaaegu nagu tagasipöördumine hajutatud andmetöötluse vana kooli mõiste juurde."

Gillich lisab: "Mõnikord küsivad meie kliendid: "Kus AI mängib?" – vastus on, et AI mängib kõikjal. Nii et Intelis on meie ambitsioonid keskendunud sellele, mida võiks nimetada AI universaalseks kohandumiseks, sest usume, et see laieneb kõikidele rakendusvaldkondadele.

Inteli puhul hõlmab see vahevara, näiteks API-sid, mis nagu mis tahes muu tarkvaravirna osa puhul peavad olema võimalikult tõhusad. API laialivalgumine võib põhjustada tarbetut töötlemist, minimeerida nende infrastruktuuri jalajälge ning järelevalve ja kontrolli puudumist.

„Koos Intel oneAPI, saavad ettevõtted realiseerida oma täieliku riistvaraväärtuse, arendada suure jõudlusega ristarhitektuurilist koodi ja teha oma rakendused tulevaste vajaduste jaoks valmis,“ selgitab Gillich.

„Intel oneAPI on avatud, valdkondadevaheline, standarditel põhinev, ühtne, mitmearhitektuuriline, mitme tootja programmeerimismudel, mis pakub kiirendiarhitektuurides ühtset arendajakogemust – rakenduste kiiremaks jõudluseks ja tootlikkuse parandamiseks. OneAPI algatus julgustab koostööd oneAPI spetsifikatsiooni ja ühilduvate oneAPI rakenduste osas kogu ökosüsteemis.

Gillich lisab: "oneAPI pakub vahevaravirnu, mis võtab standardseid asju, nagu AI Frameworks (nt Pytorch või TensorFlow [avatud lähtekoodiga tarkvaraplatvorm AI ja masinõppe jaoks]) ja tõlgib need masina tasemel ning oneAPI võimaldab tõhusat viisi tee seda. Kasutajad saavad kasutada ühist API-d Ai raamistiku tasemel ja meil on API (oneAPI), mis käsitleb erinevaid riistvara maitseid. Nii et tavaline API tähendab, et kasutajad saavad luua avatud tarkvara, mida saab avatud tarkvaravirnas toetada.

GPU-tasemel jõudlus CPU-tasemel hinnapunktides

IT-valdkonna edusammud on suuresti ajendatud ootusest pidevale tehnoloogilisele arengule, mis on seotud juurutusstrateegiate ülevaatepõhise täiustamisega. See on mudel, mis põhineb parima võimaliku tasakaalu leidmisel eelarvekulude ja ettevõtte investeeringutasuvuse vahel ning ootusel, et alati on vaja edasist uuendust, mille poole püüelda. AI esindab selle ideaali apogeed – see on piisavalt tark, et leiutada oma väärtuspakkumine pideva enesetäiendamise kaudu.

Ehitades AMX-i kiirendi oma 4. põlvkonna Intel Xeon CPU-desse, näitab Intel, kuidas on võimalik saavutada GPU-tasemel jõudlust CPU-tasemel hinnapunktides. See võimaldab andmekeskustel skaleerida, maksimeerides samal ajal nende olemasolevate Intel Xeoni toega töötlemisseadmete tootlust, kuid pakub ka hinnamudelit, mis vähendab AI-töökoormusega, kuid piiratud eelarvega klientide sisenemiskulusid.

Ja protsessorite väiksem energiatarve tähendab, et energiatõhusust on võimalik saavutada terviklikult andmekeskuse kogu toimingu (nt jahutuse ja ventilatsiooni) jooksul ning see on veel üks võitnud tõmbejõud jätkusuutlikkuse suhtes kohusetundlikele tarkvaraarhitektidele ja AL-lahenduste arendajatele.

Panustas Intel.