Intel prépare des puces Gaudi 3 à faible consommation pour la Chine

Intel prépare des puces Gaudi 3 à faible consommation pour la Chine

Intel prépare des puces Gaudi 3 à faible consommation pour la Chine PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Intel est sur le point de lancer deux modèles exclusifs en Chine de son accélérateur d'IA Gaudi 3, et ils seront considérablement paralysés pour s'adapter aux sanctions américaines.

L'existence de deux modèles homologués à la vente dans l'Empire du Milieu est détaillée dans Livre blanc Gaudi 3 d'Intel. Appelés HL-328 et HL-388, les processeurs fabriqués pour la Chine sont respectivement aux formats OAM et PCIe, le premier étant lancé en juin et le second en septembre, aux côtés de l'autre facteur de forme PCIe Gaudi 3.

Dans l’ensemble, le HL-328 et le HL-388 se ressemblent plus ou moins les autres, avec les mêmes 128 Go de VRAM HBM2e avec 3.7 To/s de bande passante, 96 Mo de cache, une interface PCIe 5.0 x16 et des normes de décodage.

La seule différence concerne la puissance thermique de conception, qui est de 450 watts pour les modèles de carte OAM et PCIe. Il s'agit d'une réduction substantielle par rapport aux autres modèles. Le PCIe HL-338 non chinois a un TDP de 600 watts, et les facteurs de forme OAM HL-325L et HL-335 transportent 900 watts. Le TDP relativement faible des modèles China Gaudi 3 est probablement la raison pour laquelle il n'existe pas de version refroidie par liquide.

Bien que cela ne soit pas explicitement indiqué dans le livre blanc, les modifications étaient presque certainement nécessaires pour se conformer aux Contrôles des exportations du gouvernement américain sur les processeurs, qui interdisent aux entreprises américaines d'exporter des puces vers la Chine en fonction de leurs performances. 

Nous ne pouvons pas vraiment savoir ce qu'Intel a fait avec Gaudi 3 pour le rendre conforme et à quelle vitesse ces puces approuvées pour la Chine fonctionnent avec ces changements, mais il existe quelques indices. Les HL-328 et HL-388 utilisent toujours deux puces, comme les autres variantes de Gaudi 3, puisque la configuration de la mémoire et du cache est inchangée. L'utilisation de deux puces au lieu d'une contribue à réduire la densité de performances, permettant à la puce d'atteindre la limite d'exportation la plus élevée de 4,800 XNUMX puissance de traitement totale (TPP).

Cette limite de 4,800 150 TPP signifie qu'aucune puce ne peut avoir 16 TFLOPS ou plus de performances 3 bits, et puisque Gaudi 1,835 peut faire jusqu'à 16 XNUMX TFLOPS à BFXNUMX, Intel devrait réduire considérablement les performances. Cela devrait être accompli par une réduction vraiment massive du nombre de cœurs et de la vitesse d'horloge, ou par une autre méthode limitant les performances.

Nous avons demandé à Intel des éclaircissements sur les modèles Gaudi 3 exclusifs à la Chine et nous n'avons pas encore reçu de réponse. Nous mettrons à jour si Intel divulgue des informations.

Nous pouvons probablement nous attendre à ce que les HL-328 et HL-388 fonctionnent de manière similaire à Le H20 de Nvidia, le GPU le plus rapide de ce titan de silicium dont la vente est approuvée en Chine. Il dispose de 148 TFLOPS de performances FB16 et FP16, juste en dessous de la limite de 150 TFLOPS.

Étant donné que les performances brutes du cœur seront plus ou moins égales entre le H20 et les modèles chinois de Gaudi 3, la principale différence résidera dans la mémoire, où Intel a plus de capacité mais légèrement moins de bande passante, et dans le logiciel, qui a toujours été un argument de vente. pour les puces Nvidia. ®

Horodatage:

Plus de Le registre