Intel menyiapkan chip Gaudi 3 berdaya rendah untuk Tiongkok

Intel menyiapkan chip Gaudi 3 berdaya rendah untuk Tiongkok

Intel menyiapkan chip Gaudi 3 berdaya rendah untuk China PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Intel akan meluncurkan dua model akselerator AI Gaudi 3 eksklusif Tiongkok, dan model tersebut akan sangat lumpuh untuk menyesuaikan dengan sanksi AS.

Keberadaan dua model yang disetujui untuk dijual di Kerajaan Tengah dirinci Buku putih Intel Gaudi 3. Disebut HL-328 dan HL-388, prosesor yang dibuat untuk Tiongkok masing-masing berada dalam faktor bentuk OAM dan PCIe, dengan yang pertama diluncurkan pada bulan Juni dan yang terakhir pada bulan September, bersama dengan faktor bentuk PCIe lainnya Gaudi 3.

Secara keseluruhan, HL-328 dan HL-388 terlihat kurang lebih sama dengan yang lain, dengan VRAM HBM128e 2 GB yang sama dengan bandwidth 3.7 TB/dtk, cache 96 MB, antarmuka PCIe 5.0 x16, dan standar decoding.

Satu-satunya perbedaan adalah pada daya desain termal, yaitu 450 watt untuk model kartu OAM dan PCIe. Ini merupakan pengurangan yang signifikan dibandingkan model lainnya. PCIe HL-338 non-China memiliki TDP 600 watt, dan faktor bentuk OAM HL-325L dan HL-335 memiliki daya 900 watt. TDP yang relatif rendah pada model China Gaudi 3 mungkin menjadi alasan mengapa tidak ada versi berpendingin cairan.

Meskipun tidak disebutkan secara eksplisit dalam whitepaper, perubahan tersebut hampir pasti diperlukan untuk mematuhi peraturan Kontrol ekspor pemerintah AS pada prosesor, yang melarang perusahaan-perusahaan Amerika mengekspor chip ke Tiongkok tergantung pada kinerjanya. 

Kita tidak dapat benar-benar mengetahui apa yang telah dilakukan Intel dengan Gaudi 3 untuk membuatnya patuh dan seberapa cepat kinerja chip yang disetujui untuk Tiongkok ini dengan perubahan ini, namun ada beberapa petunjuk. HL-328 dan HL-388 masih menggunakan dua cetakan, seperti varian Gaudi 3 lainnya, karena konfigurasi memori dan cache tidak berubah. Penggunaan dua cetakan, bukan satu, membantu mengurangi kepadatan kinerja, memungkinkan chip mencapai batas ekspor yang lebih tinggi yaitu 4,800 total daya pemrosesan (TPP).

Batasan 4,800 TPP ini berarti bahwa tidak ada chip yang dapat memiliki kinerja 150-bit 16 TFLOPS atau lebih, dan karena Gaudi 3 dapat melakukan hingga 1,835 TFLOPS di BF16, Intel perlu mengurangi kinerja secara signifikan. Hal ini harus dicapai dengan pengurangan besar-besaran pada jumlah inti dan kecepatan clock, atau metode lain yang membatasi kinerja.

Kami telah meminta klarifikasi Intel mengenai model Gaudi 3 eksklusif Tiongkok dan kami belum mendapat tanggapan. Kami akan memperbarui jika Intel mengungkapkan informasi apa pun.

Kita mungkin dapat mengharapkan HL-328 dan HL-388 memiliki kinerja serupa H20 milik Nvidia, GPU tercepat dari titan silikon yang disetujui untuk dijual di Tiongkok. Ia memiliki kinerja FB148 dan FP16 16 TFLOPS, tepat di bawah batas 150-TFLOPS.

Karena kinerja inti mentah akan kurang lebih sama antara H20 dan model Gaudi 3 China, perbedaan utamanya terletak pada memori, di mana Intel memiliki kapasitas lebih besar tetapi bandwidth sedikit lebih sedikit, dan perangkat lunak, yang selalu menjadi nilai jual. untuk chip Nvidia. ยฎ

Stempel Waktu:

Lebih dari Pendaftaran