Intel เตรียมชิป Gaudi 3 พลังงานต่ำสำหรับประเทศจีน

Intel เตรียมชิป Gaudi 3 พลังงานต่ำสำหรับประเทศจีน

Intel เตรียมชิป Gaudi 3 ที่ใช้พลังงานต่ำสำหรับ China PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

Intel เตรียมเปิดตัวเครื่องเร่งความเร็ว Gaudi 3 AI รุ่นเอกสิทธิ์เฉพาะของจีนสองรุ่น และจะพิการอย่างมากเพื่อให้สอดคล้องกับมาตรการคว่ำบาตรของสหรัฐฯ

การมีอยู่ของสองรุ่นที่ได้รับการอนุมัติสำหรับการขายในราชอาณาจักรกลางมีรายละเอียดอยู่ใน เอกสารไวท์เปเปอร์ Gaudi 3 ของ Intel- โปรเซสเซอร์ที่ผลิตสำหรับจีนเรียกว่า HL-328 และ HL-388 ซึ่งอยู่ในรูปแบบ OAM และ PCIe ตามลำดับ โดยก่อนหน้านี้จะเปิดตัวในเดือนมิถุนายนและรุ่นหลังในเดือนกันยายน ควบคู่ไปกับ Gaudi 3 ในรูปแบบ PCIe อื่นๆ

โดยรวมแล้ว HL-328 และ HL-388 ดูไม่มากก็น้อยเหมือนกับรุ่นอื่นๆ โดยมี HBM128e VRAM ขนาด 2GB เท่าเดิม พร้อมแบนด์วิธ 3.7TB/s, แคช 96MB, อินเทอร์เฟซ PCIe 5.0 x16 และมาตรฐานการถอดรหัส

ข้อแตกต่างเพียงอย่างเดียวคือเกี่ยวกับพลังการออกแบบการระบายความร้อนซึ่งก็คือ 450 วัตต์สำหรับทั้งรุ่นการ์ด OAM และ PCIe ซึ่งถือว่าลดลงอย่างมากจากรุ่นอื่นๆ PCIe HL-338 ที่ไม่ใช่ประเทศจีนมี TDP 600 วัตต์ และฟอร์มแฟคเตอร์ OAM HL-325L และ HL-335 มี 900 วัตต์ TDP ที่ค่อนข้างต่ำในรุ่น China Gaudi 3 น่าจะเป็นเหตุผลว่าทำไมจึงไม่มีรุ่นระบายความร้อนด้วยของเหลว

แม้ว่าจะไม่ได้ระบุไว้อย่างชัดเจนในเอกสารไวท์เปเปอร์ แต่การเปลี่ยนแปลงก็เกือบจะจำเป็นอย่างแน่นอนเพื่อให้สอดคล้องกับ การควบคุมการส่งออกของรัฐบาลสหรัฐฯ บนโปรเซสเซอร์ซึ่งห้ามบริษัทอเมริกันส่งออกชิปไปยังประเทศจีนโดยขึ้นอยู่กับประสิทธิภาพ 

เราไม่สามารถรู้ได้จริงๆ ว่า Intel ทำอะไรกับ Gaudi 3 เพื่อให้เป็นไปตามข้อกำหนด และความเร็วของชิปที่ได้รับการอนุมัติสำหรับจีนเหล่านี้ดำเนินการอย่างไรกับการเปลี่ยนแปลงเหล่านี้ แต่มีเบาะแสบางประการ HL-328 และ HL-388 ยังคงใช้แม่พิมพ์สองตัว เช่นเดียวกับรุ่น Gaudi 3 อื่นๆ เนื่องจากการกำหนดค่าหน่วยความจำและแคชไม่มีการเปลี่ยนแปลง การใช้แม่พิมพ์สองตัวแทนตัวเดียวจะช่วยลดความหนาแน่นของประสิทธิภาพ ทำให้ชิปสามารถเข้าถึงขีดจำกัดการส่งออกที่สูงขึ้นที่พลังการประมวลผลทั้งหมด (TPP) 4,800

ขีดจำกัด 4,800 TPP หมายความว่าไม่มีชิปใดสามารถมีประสิทธิภาพ 150 TFLOPS หรือมากกว่า 16 บิต และเนื่องจาก Gaudi 3 สามารถทำได้ถึง 1,835 TFLOPS ที่ BF16 Intel จึงต้องลดประสิทธิภาพลงอย่างมาก สิ่งนี้จะต้องทำให้สำเร็จได้ด้วยการลดจำนวนคอร์และความเร็วสัญญาณนาฬิกาลงอย่างมาก หรือวิธีการจำกัดประสิทธิภาพอื่นๆ

เราได้ขอให้ Intel ชี้แจงเกี่ยวกับรุ่น Gaudi 3 ที่เป็นเอกสิทธิ์เฉพาะของจีน และเรายังไม่ได้รับการตอบกลับ เราจะอัปเดตหาก Intel เปิดเผยข้อมูลใดๆ

เราอาจคาดหวังได้ว่า HL-328 และ HL-388 จะทำงานคล้ายกัน H20 ของ NvidiaGPU ที่เร็วที่สุดของ Silicon Titan ที่ได้รับอนุมัติให้จำหน่ายในประเทศจีน มีประสิทธิภาพ 148 TFLOPS ของ FB16 และ FP16 ซึ่งอยู่ภายใต้ขีดจำกัด 150-TFLOPS

เนื่องจากประสิทธิภาพคอร์ดิบจะเท่ากันไม่มากก็น้อยระหว่าง Gaudi 20 รุ่น H3 และจีน ความแตกต่างหลัก ๆ อยู่ที่หน่วยความจำ โดยที่ Intel มีความจุมากกว่าแต่แบนด์วิธน้อยกว่าเล็กน้อย และซอฟต์แวร์ซึ่งเป็นจุดขายมาโดยตลอด สำหรับชิป NVIDIA

ประทับเวลา:

เพิ่มเติมจาก ลงทะเบียน