Intel bereitet Gaudi 3-Chips mit geringerer Leistung für China vor

Intel bereitet Gaudi 3-Chips mit geringerer Leistung für China vor

Intel bereitet Gaudi 3-Chips mit geringerem Stromverbrauch für China PlatoBlockchain Data Intelligence vor. Vertikale Suche. Ai.

Intel wird voraussichtlich zwei exklusiv für China erhältliche Modelle seines KI-Beschleunigers Gaudi 3 auf den Markt bringen, die jedoch erheblich eingeschränkt werden, um den US-Sanktionen gerecht zu werden.

Die Existenz von zwei Modellen, die im Reich der Mitte zum Verkauf zugelassen sind, wird in detailliert beschrieben Intels Whitepaper zu Gaudi 3. Die für China hergestellten Prozessoren mit der Bezeichnung HL-328 und HL-388 sind im OAM- bzw. PCIe-Formfaktor erhältlich, wobei ersterer im Juni und letzterer im September auf den Markt kommt, zusammen mit dem anderen PCIe-Formfaktor Gaudi 3.

Insgesamt sehen der HL-328 und der HL-388 mehr oder weniger gleich aus wie die anderen, mit den gleichen 128 GB HBM2e-VRAM mit 3.7 TB/s Bandbreite, 96 MB Cache, PCIe 5.0 x16-Schnittstelle und denselben Decodierungsstandards.

Der einzige Unterschied besteht in der thermischen Designleistung, die sowohl beim OAM- als auch beim PCIe-Kartenmodell 450 Watt beträgt. Dies ist eine erhebliche Reduzierung gegenüber den anderen Modellen. Der nicht aus China stammende PCIe HL-338 hat eine TDP von 600 Watt, und die OAM-Formfaktoren HL-325L und HL-335 haben 900 Watt. Die relativ niedrige TDP der China Gaudi 3-Modelle ist vermutlich der Grund dafür, dass es keine flüssigkeitsgekühlte Version gibt.

Auch wenn dies im Whitepaper nicht ausdrücklich erwähnt wird, war die Durchführung der Änderungen mit ziemlicher Sicherheit notwendig, um den Anforderungen zu entsprechen Exportkontrollen der US-Regierung auf Prozessoren, die es amerikanischen Unternehmen verbieten, je nach Leistung Chips nach China zu exportieren. 

Wir können nicht wirklich wissen, was Intel mit Gaudi 3 gemacht hat, um es konform zu machen und wie schnell diese für China zugelassenen Chips mit diesen Änderungen funktionieren, aber es gibt einige Hinweise. Der HL-328 und der HL-388 verwenden wie die anderen Gaudi-3-Varianten weiterhin zwei Chips, da die Speicher- und Cache-Konfiguration unverändert ist. Die Verwendung von zwei Chips anstelle von einem trägt dazu bei, die Leistungsdichte zu reduzieren, sodass der Chip die höhere Exportgrenze von 4,800 Total Processing Power (TPP) erreichen kann.

Das Limit von 4,800 TPP bedeutet, dass kein Chip 150 TFLOPS oder mehr 16-Bit-Leistung haben kann, und da Gaudi 3 bei BF1,835 bis zu 16 TFLOPS erreichen kann, müsste Intel die Leistung erheblich reduzieren. Dies müsste durch eine wirklich massive Reduzierung der Kernanzahl und Taktrate oder eine andere leistungsbegrenzende Methode erreicht werden.

Wir haben Intel um Klarstellung zu den in China erhältlichen Gaudi 3-Modellen gebeten und noch keine Antwort erhalten. Wir werden aktualisieren, wenn Intel Informationen veröffentlicht.

Wir können wahrscheinlich davon ausgehen, dass der HL-328 und der HL-388 eine ähnliche Leistung erbringen Nvidias H20, die schnellste GPU des Silizium-Titanen, die in China zum Verkauf zugelassen ist. Die FB148- und FP16-Leistung liegt bei 16 TFLOPS, knapp unter der 150-TFLOPS-Grenze.

Da die reine Kernleistung zwischen dem H20 und den China-Modellen von Gaudi 3 mehr oder weniger gleich sein wird, liegt der Hauptunterschied im Speicher, wo Intel über mehr Kapazität, aber etwas weniger Bandbreite verfügt, und in der Software, die schon immer ein Verkaufsargument war für Nvidia-Chips. ®

Zeitstempel:

Mehr von Das Register