Intel、中国向けに低消費電力のGaudi 3チップを準備

Intel、中国向けに低消費電力のGaudi 3チップを準備

インテルは、中国の PlatoBlockchain Data Intelligence 向けに低消費電力の Ga​​udi 3 チップを準備しています。垂直検索。あい。

インテルは、Gaudi 3 AI アクセラレーターの中国限定モデル XNUMX つを発売する予定だが、これらは米国の制裁に合わせて大幅に機能不全になるだろう。

中王国で販売が承認された 2 つのモデルの存在については、次の記事で詳しく説明されています。 IntelのGaudi 3ホワイトペーパー。 HL-328 および HL-388 と呼ばれるこの中国製プロセッサは、それぞれ OAM および PCIe フォームファクタで、前者は 3 月に、後者は XNUMX 月に、他の PCIe フォームファクタの Gaudi XNUMX とともに発売されます。

全体として、HL-328 と HL-388 は他とほぼ同じように見えます。同じ 128GB の HBM2e VRAM、3.7TB/秒の帯域幅、96MB のキャッシュ、PCIe 5.0 x16 インターフェイス、およびデコード規格を備えています。

唯一の違いは熱設計電力に関するもので、OAM カード モデルと PCIe カード モデルの両方で 450 ワットです。これは他のモデルに比べて大幅な削減です。中国以外の PCIe HL-338 の TDP は 600 ワットで、OAM フォームファクターの HL-325L および HL-335 は 900 ワットを伝送します。中国の Gaudi 3 モデルの TDP が比較的低いことが、水冷バージョンがない理由と考えられます。

ホワイトペーパーには明示的に記載されていませんが、変更を加えることがほぼ確実に必要でした。 米国政府の輸出規制 プロセッサに関しては、米国企業が性能に応じて中国にチップを輸出することを禁止している。 

Intel が Gaudi 3 に準拠するために何を行ったのか、またこれらの変更により中国向けに承認されたチップがどの程度高速に動作するのかを実際に知ることはできませんが、いくつかの手がかりはあります。 HL-328 と HL-388 は、メモリとキャッシュの構成が変更されていないため、他の Gaudi 3 バリアントと同様に 4,800 つのダイを使用します。 XNUMX つのダイの代わりに XNUMX つのダイを使用すると、パフォーマンス密度が低下し、チップが合計処理能力 (TPP) XNUMX というより高い輸出制限に達することが可能になります。

4,800 TPP 制限が意味するのは、150 ビット パフォーマンスで 16 TFLOPS 以上のチップは存在できないということです。Gaudi 3 は BF1,835 で最大 16 TFLOPS を実現できるため、Intel はパフォーマンスを大幅に削減する必要があるでしょう。これを実現するには、コア数とクロック速度を大幅に削減するか、その他のパフォーマンスを制限する方法を使用する必要があります。

私たちはインテルに中国限定の Gaudi 3 モデルについての説明を求めましたが、まだ返答はありません。 Intel が情報を開示した場合は更新します。

おそらく HL-328 と HL-388 も同様のパフォーマンスを期待できます。 NvidiaのH20、中国での販売が承認されたシリコンタイタンの最速GPUです。 FB148 および FP16 のパフォーマンスは 16 TFLOPS で、制限の 150 TFLOPS をわずかに下回ります。

コアの生のパフォーマンスは Gaudi 20 の H3 モデルと中国モデルでほぼ同等になるため、主な違いは、Intel の方が容量は多いが帯域幅がわずかに少ないメモリと、常にセールスポイントであるソフトウェアに帰着します。 Nvidiaチップ用。 ®

タイムスタンプ:

より多くの 登録