تقوم شركة إنتل بإعداد شرائح Gaudi 3 ذات الطاقة المنخفضة للصين

تقوم شركة إنتل بإعداد شرائح Gaudi 3 ذات الطاقة المنخفضة للصين

تقوم إنتل بإعداد شرائح Gaudi 3 ذات الطاقة المنخفضة لذكاء بيانات PlatoBlockchain في الصين. البحث العمودي. منظمة العفو الدولية.

من المقرر أن تطلق شركة إنتل نموذجين حصريين للصين من مسرع Gaudi 3 AI، وسيكونان معوقين إلى حد كبير ليتناسبا مع العقوبات الأمريكية.

نوضح بالتفصيل وجود نموذجين معتمدين للبيع في المملكة الوسطى ورقة عمل إنتل غاودي 3. تسمى المعالجات HL-328 و HL-388، وهي مصنوعة للصين في عوامل الشكل OAM و PCIe على التوالي، مع إطلاق الأول في يونيو والأخير في سبتمبر، إلى جانب عامل الشكل PCIe الآخر Gaudi 3.

بشكل عام، يبدو الطرازان HL-328 وHL-388 متشابهين تقريبًا مع الطرازين الآخرين، مع نفس ذاكرة HBM128e VRAM سعة 2 جيجابايت مع عرض نطاق ترددي يبلغ 3.7 تيرابايت/ثانية، وذاكرة تخزين مؤقت سعة 96 ميجابايت، وواجهة PCIe 5.0 x16، ومعايير فك التشفير.

والفرق الوحيد هو فيما يتعلق بقوة التصميم الحراري، والتي تبلغ 450 واط لكل من طرازي بطاقة OAM وPCIe. وهذا يمثل تخفيضًا كبيرًا عن النماذج الأخرى. يحتوي PCIe HL-338 غير الصيني على TDP يبلغ 600 واط، بينما يحمل عامل الشكل OAM HL-325L وHL-335 900 واط. من المفترض أن يكون TDP المنخفض نسبيًا في نماذج China Gaudi 3 هو سبب عدم وجود نسخة مبردة بالسوائل.

على الرغم من عدم ذكر ذلك صراحةً في المستند التقني، إلا أنه كان من المؤكد تقريبًا أن إجراء التغييرات ضروري للامتثال للمتطلبات ضوابط التصدير التي تفرضها حكومة الولايات المتحدة على المعالجات، والتي تمنع الشركات الأمريكية من تصدير الرقائق إلى الصين اعتمادًا على الأداء. 

لا يمكننا أن نعرف حقًا ما الذي فعلته Intel مع Gaudi 3 لجعلها متوافقة ومدى سرعة أداء هذه الرقائق المعتمدة للصين مع هذه التغييرات، ولكن هناك بعض الأدلة. لا يزال الطرازان HL-328 وHL-388 يستخدمان قالبين، مثل متغيرات Gaudi 3 الأخرى، حيث لم يتغير تكوين الذاكرة وذاكرة التخزين المؤقت. يساعد استخدام قالبين بدلاً من قالب واحد على تقليل كثافة الأداء، مما يسمح للرقاقة بالوصول إلى الحد الأعلى للتصدير وهو 4,800 إجمالي طاقة المعالجة (TPP).

ما يعنيه حد 4,800 TPP هو أنه لا يمكن لأي شريحة أن تحتوي على 150 TFLOPS أو أكثر من أداء 16 بت، وبما أن Gaudi 3 يمكنه القيام بما يصل إلى 1,835 TFLOPS في BF16، فستحتاج Intel إلى خفض الأداء بشدة. يجب أن يتم تحقيق ذلك من خلال خفض كبير حقًا في عدد النواة وسرعة الساعة، أو بعض الطرق الأخرى التي تحد من الأداء.

لقد طلبنا من شركة Intel توضيحًا بشأن طرازات Gaudi 3 الحصرية في الصين ولم نتلق أي رد حتى الآن. سنقوم بالتحديث إذا كشفت Intel عن أي معلومات.

ربما يمكننا أن نتوقع أداء HL-328 وHL-388 بشكل مشابه نفيديا H20، أسرع وحدة معالجة رسومات من إنتاج شركة السيليكون والتي تمت الموافقة على بيعها في الصين. لديها 148 TFLOPS من أداء FB16 وFP16، أقل بقليل من حد 150-TFLOPS.

نظرًا لأن الأداء الأساسي الخام سيكون متساويًا إلى حد ما بين H20 ونماذج Gaudi 3 الصينية، فإن الاختلاف الرئيسي سيتلخص في الذاكرة، حيث تتمتع Intel بقدرة أكبر ولكن عرض نطاق ترددي أقل قليلاً، والبرمجيات، التي كانت دائمًا نقطة بيع لرقائق نفيديا. ®

الطابع الزمني:

اكثر من السجل