Intel forbereder Gaudi 3-chips med lavere effekt til Kina

Intel forbereder Gaudi 3-chips med lavere effekt til Kina

Intel forbereder Gaudi 3-chips med lavere effekt til China PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Intel er klar til at lancere to Kina-eksklusive modeller af sin Gaudi 3 AI-accelerator, og de vil være væsentligt forkrøblede for at passe ind i amerikanske sanktioner.

Eksistensen af ​​to modeller, der er godkendt til salg i Mellemriget, er detaljeret beskrevet i Intels Gaudi 3 whitepaper. Kaldet HL-328 og HL-388, de fremstillede til Kina-processorer er i henholdsvis OAM- og PCIe-formfaktorerne, hvor førstnævnte lanceres i juni og sidstnævnte i september sammen med den anden PCIe-formfaktor Gaudi 3.

Samlet set ser HL-328 og HL-388 nogenlunde det samme ud som de andre, med de samme 128 GB HBM2e VRAM med 3.7 TB/s båndbredde, 96 MB cache, PCIe 5.0 x16 interface og afkodningsstandarder.

Den eneste forskel er med hensyn til termisk designeffekt, som er 450 watt for både OAM- og PCIe-kortmodellerne. Dette er en væsentlig reduktion i forhold til de andre modeller. Den ikke-kinesiske PCIe HL-338 har en TDP på ​​600 watt, og OAM-formfaktoren HL-325L og HL-335 bærer 900 watt. Den relativt lave TDP på ​​China Gaudi 3-modellerne er formodentlig grunden til, at der ikke er nogen væskekølet version.

Selvom det ikke var udtrykkeligt angivet i hvidbogen, var det næsten helt sikkert nødvendigt at foretage ændringerne for at overholde Den amerikanske regerings eksportkontrol på processorer, som forbyder amerikanske virksomheder at eksportere chips til Kina afhængigt af ydeevne. 

Vi kan ikke rigtig vide, hvad Intel har gjort med Gaudi 3 for at gøre den kompatibel, og hvor hurtigt disse godkendte-til-Kina-chips yder med disse ændringer, men der er nogle spor. HL-328 og HL-388 bruger stadig to dies, ligesom de andre Gaudi 3-varianter, da hukommelsen og cache-konfigurationen er uændret. Brug af to matricer i stedet for én hjælper med at reducere ydeevnetætheden, hvilket gør det muligt for chippen at nå den højere eksportgrænse på 4,800 total processorkraft (TPP).

Hvad den 4,800 TPP-grænse betyder, er, at ingen chip kan have 150 TFLOPS eller mere af 16-bit ydeevne, og da Gaudi 3 kan klare op til 1,835 TFLOPS ved BF16, ville Intel være nødt til at skære kraftigt ned i ydeevnen. Dette ville skulle opnås ved en virkelig massiv nedskæring af kerneantal og klokhastighed eller en anden præstationsbegrænsende metode.

Vi har bedt Intel om en afklaring på de Kina-eksklusive Gaudi 3-modeller, og vi har ikke hørt tilbage endnu. Vi opdaterer, hvis Intel afslører nogen oplysninger.

Vi kan formentlig forvente, at HL-328 og HL-388 yder tilsvarende Nvidias H20, silicium titans hurtigste GPU, der er godkendt til salg i Kina. Den har 148 TFLOPS af FB16 og FP16 ydeevne, lige under grænsen på 150 TFLOPS.

Da rå kerneydelse vil være nogenlunde ens mellem H20 og Kina-modellerne af Gaudi 3, vil den største forskel komme til hukommelsen, hvor Intel har mere kapacitet, men lidt mindre båndbredde, og software, som altid har været et salgsargument til Nvidia-chips. ®

Tidsstempel:

Mere fra Registret