Intel förbereder Gaudi 3-chips med lägre effekt för Kina

Intel förbereder Gaudi 3-chips med lägre effekt för Kina

Intel förbereder Gaudi 3-chips med lägre effekt för China PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Intel kommer att lansera två Kina-exklusiva modeller av sin Gaudi 3 AI-accelerator, och de kommer att vara avsevärt förlamade för att passa in i amerikanska sanktioner.

Förekomsten av två modeller godkända för försäljning i Mellanriket beskrivs i detalj i Intels Gaudi 3 whitepaper. Kallas HL-328 och HL-388, de tillverkade för Kina-processorer är i formfaktorerna OAM respektive PCIe, med den förra lanseras i juni och den senare i september, tillsammans med den andra PCIe-formfaktorn Gaudi 3.

Sammantaget ser HL-328 och HL-388 ungefär likadana ut som de andra, med samma 128 GB HBM2e VRAM med 3.7 TB/s bandbredd, 96 MB cache, PCIe 5.0 x16-gränssnitt och avkodningsstandarder.

Den enda skillnaden ligger i termisk designeffekt, som är 450 watt för både OAM- och PCIe-kortmodellerna. Detta är en avsevärd minskning från de andra modellerna. Den icke-kinesiska, PCIe HL-338 har en TDP på ​​600 watt, och OAM-formfaktorn HL-325L och HL-335 bär 900 watt. Den relativt låga TDP på ​​China Gaudi 3-modellerna är förmodligen varför det inte finns någon vätskekyld version.

Även om det inte uttryckligen anges i vitboken, var det nästan säkert nödvändigt att göra ändringarna för att följa USA:s regerings exportkontroll på processorer, som förbjuder amerikanska företag att exportera chips till Kina beroende på prestanda. 

Vi kan inte riktigt veta vad Intel har gjort med Gaudi 3 för att göra den kompatibel och hur snabbt dessa godkända för Kina-chips presterar med dessa ändringar, men det finns några ledtrådar. HL-328 och HL-388 använder fortfarande två dies, som de andra Gaudi 3-varianterna, eftersom minnes- och cachekonfigurationen är oförändrad. Att använda två dys istället för en hjälper till att minska prestandatätheten, vilket gör att chippet når den högre exportgränsen på 4,800 XNUMX total processorkraft (TPP).

Vad den gränsen på 4,800 150 TPP betyder är att inget chip kan ha 16 TFLOPS eller mer av 3-bitars prestanda, och eftersom Gaudi 1,835 kan göra upp till 16 XNUMX TFLOPS vid BFXNUMX, skulle Intel behöva sänka prestandan rejält. Detta skulle behöva åstadkommas genom en verkligt massiv nedskärning av kärnantalet och klockhastigheten, eller någon annan prestandabegränsande metod.

Vi har bett Intel om ett förtydligande om de Kina-exklusiva Gaudi 3-modellerna och vi har inte hört något ännu. Vi uppdaterar om Intel avslöjar någon information.

Vi kan förmodligen förvänta oss att HL-328 och HL-388 kommer att prestera liknande Nvidias H20, den kiseltitans snabbaste GPU som är godkänd för försäljning i Kina. Den har 148 TFLOPS av FB16 och FP16 prestanda, strax under gränsen på 150 TFLOPS.

Eftersom rå kärnprestanda kommer att vara mer eller mindre lika mellan H20 och Kina-modellerna av Gaudi 3, kommer den största skillnaden att komma till minne, där Intel har mer kapacitet men något mindre bandbredd, och mjukvara, som alltid har varit ett försäljningsargument för Nvidia-chips. ®

Tidsstämpel:

Mer från Registret