Intel pregătește cipuri Gaudi 3 de putere redusă pentru China

Intel pregătește cipuri Gaudi 3 de putere redusă pentru China

Intel pregătește cipuri Gaudi 3 de putere redusă pentru China PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Intel urmează să lanseze două modele exclusive pentru China ale acceleratorului său Gaudi 3 AI, iar acestea vor fi afectate în mod substanțial pentru a se potrivi cu sancțiunile SUA.

Existența a două modele omologate pentru vânzare în Regatul Mijlociu este detaliată în Cartea albă Intel Gaudi 3. Denumite HL-328 și HL-388, procesoarele create pentru China sunt în factorii de formă OAM și, respectiv, PCIe, primul fiind lansat în iunie și cel de-al doilea în septembrie, alături de celălalt factor de formă PCIe Gaudi 3.

În general, HL-328 și HL-388 arată mai mult sau mai puțin la fel ca celelalte, cu aceiași 128 GB de HBM2e VRAM cu 3.7 TB/s lățime de bandă, 96 MB de cache, interfață PCIe 5.0 x16 și standarde de decodare.

Singura diferență este în ceea ce privește puterea de proiectare termică, care este de 450 de wați atât pentru modelele de card OAM, cât și pentru cele PCIe. Aceasta este o reducere substanțială față de celelalte modele. Non-China, PCIe HL-338 are un TDP de 600 de wați, iar factorul de formă OAM HL-325L și HL-335 transportă 900 de wați. TDP-ul relativ scăzut al modelelor China Gaudi 3 este probabil motivul pentru care nu există o versiune răcită cu lichid.

Deși nu este menționat în mod explicit în cartea albă, efectuarea modificărilor a fost aproape sigur necesară pentru a se conforma Controalele la export ale guvernului SUA pe procesoare, care interzic companiilor americane să exporte cipuri în China, în funcție de performanță. 

Nu putem ști cu adevărat ce a făcut Intel cu Gaudi 3 pentru a-l face compatibil și cât de repede funcționează aceste cipuri aprobate pentru China cu aceste modificări, dar există câteva indicii. HL-328 și HL-388 încă folosesc două matrițe, ca și celelalte variante Gaudi 3, deoarece configurația memoriei și a cache-ului este neschimbată. Utilizarea a două matrițe în loc de una ajută la reducerea densității performanței, permițând cipului să atingă limita mai mare de export de 4,800 de putere totală de procesare (TPP).

Ceea ce înseamnă această limită de 4,800 TPP este că niciun cip nu poate avea 150 TFLOPS sau mai mult de performanță pe 16 biți și, deoarece Gaudi 3 poate face până la 1,835 TFLOPS la BF16, Intel ar trebui să reducă performanța drastic. Acest lucru ar trebui să fie realizat printr-o reducere cu adevărat masivă a numărului de nuclee și a vitezei de ceas sau printr-o altă metodă de limitare a performanței.

Am cerut lui Intel clarificări cu privire la modelele Gaudi 3 exclusiviste pentru China și încă nu am primit răspuns. Vom actualiza dacă Intel dezvăluie informații.

Probabil ne putem aștepta ca HL-328 și HL-388 să funcționeze similar H20 de la Nvidia, cel mai rapid GPU al acelui titan de siliciu care este aprobat pentru vânzare în China. Are 148 TFLOPS de performanță FB16 și FP16, chiar sub limita de 150-TFLOPS.

Deoarece performanța de bază brută va fi mai mult sau mai puțin egală între modelele H20 și China ale lui Gaudi 3, principala diferență se va reduce la memorie, unde Intel are mai multă capacitate, dar o lățime de bandă puțin mai mică, și software, care a fost întotdeauna un punct de vânzare. pentru cipuri Nvidia. ®

Timestamp-ul:

Mai mult de la Registrul