Intel bereidt Gaudi 3-chips met lager vermogen voor voor China

Intel bereidt Gaudi 3-chips met lager vermogen voor voor China

Intel bereidt Gaudi 3-chips met lager vermogen voor voor China PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Intel staat op het punt twee exclusieve China-modellen van zijn Gaudi 3 AI-versneller te lanceren, en deze zullen aanzienlijk kreupel zijn om te passen in de Amerikaanse sancties.

Het bestaan ​​van twee modellen die in het Middenrijk voor verkoop zijn goedgekeurd, wordt gedetailleerd beschreven in Intel's Gaudi 3-whitepaper. De voor China gemaakte processors, de HL-328 en HL-388 genoemd, hebben respectievelijk de OAM- en PCIe-vormfactoren, waarbij de eerste in juni wordt gelanceerd en de laatste in september, naast de andere PCIe-vormfactor Gaudi 3.

Over het geheel genomen zien de HL-328 en de HL-388 er min of meer hetzelfde uit als de anderen, met dezelfde 128 GB HBM2e VRAM met 3.7 TB/s bandbreedte, 96 MB cache, PCIe 5.0 x16-interface en decoderingsstandaarden.

Het enige verschil betreft het thermische ontwerpvermogen, dat 450 watt bedraagt ​​voor zowel de OAM- als de PCIe-kaartmodellen. Dit is een aanzienlijke reductie ten opzichte van de andere modellen. De niet-Chinese PCIe HL-338 heeft een TDP van 600 watt, en de OAM-vormfactor HL-325L en HL-335 hebben 900 watt. De relatief lage TDP op de Chinese Gaudi 3-modellen is vermoedelijk de reden waarom er geen vloeistofgekoelde versie is.

Hoewel dit niet expliciet in de whitepaper wordt vermeld, was het aanbrengen van de wijzigingen vrijwel zeker noodzakelijk om aan de vereisten te voldoen De exportcontroles van de Amerikaanse overheid op processors, die Amerikaanse bedrijven verbieden chips naar China te exporteren, afhankelijk van de prestaties. 

We kunnen niet echt weten wat Intel met Gaudi 3 heeft gedaan om het compatibel te maken en hoe snel deze voor China goedgekeurde chips presteren met deze veranderingen, maar er zijn enkele aanwijzingen. De HL-328 en HL-388 gebruiken nog steeds twee matrijzen, net als de andere Gaudi 3-varianten, aangezien de geheugen- en cacheconfiguratie ongewijzigd zijn. Het gebruik van twee matrijzen in plaats van één helpt de prestatiedichtheid te verminderen, waardoor de chip de hogere exportlimiet van 4,800 totale verwerkingskracht (TPP) kan bereiken.

Wat die limiet van 4,800 TPP betekent, is dat geen enkele chip 150 TFLOPS of meer 16-bits prestaties kan hebben, en aangezien Gaudi 3 tot 1,835 TFLOPS kan halen bij BF16, zou Intel de prestaties ernstig moeten terugschroeven. Dit zou moeten worden bereikt door een werkelijk enorme verlaging van het aantal kernen en de kloksnelheid, of een andere prestatiebeperkende methode.

We hebben Intel om opheldering gevraagd over de voor China exclusieve Gaudi 3-modellen en we hebben nog niets gehoord. We zullen updaten als Intel informatie vrijgeeft.

We kunnen waarschijnlijk verwachten dat de HL-328 en de HL-388 vergelijkbaar zullen presteren Nvidia's H20, de snelste GPU van Silicon Titan die is goedgekeurd voor verkoop in China. Het heeft 148 TFLOPS aan FB16- en FP16-prestaties, net onder de limiet van 150 TFLOPS.

Omdat de ruwe kernprestaties min of meer gelijk zullen zijn tussen de H20- en de Chinese modellen van Gaudi 3, zal het belangrijkste verschil neerkomen op geheugen, waar Intel meer capaciteit heeft maar iets minder bandbreedte, en software, wat altijd een verkoopargument is geweest. voor Nvidia-chips. ®

Tijdstempel:

Meer van Het register