اینتل تراشه های کم مصرف Gaudi 3 را برای چین آماده می کند

اینتل تراشه های کم مصرف Gaudi 3 را برای چین آماده می کند

اینتل تراشه‌های کم‌مصرف Gaudi 3 را برای فناوری اطلاعات PlatoBlockchain چین آماده می‌کند. جستجوی عمودی Ai.

اینتل قرار است دو مدل انحصاری چینی از شتاب‌دهنده هوش مصنوعی Gaudi 3 خود را روانه بازار کند و این شتاب‌دهنده‌ها به‌طور قابل‌توجهی فلج خواهند شد تا با تحریم‌های ایالات متحده سازگار شوند.

وجود دو مدل تایید شده برای فروش در پادشاهی میانه به تفصیل شرح داده شده است کاغذ سفید Gaudi 3 اینتل. پردازنده های ساخته شده برای چین که HL-328 و HL-388 نامیده می شوند، به ترتیب در فرم فاکتورهای OAM و PCIe هستند که اولی در ماه ژوئن و دومی در ماه سپتامبر و در کنار دیگر گائودی 3 با فرمول PCIe عرضه می شوند.

به طور کلی، HL-328 و HL-388 با همان 128 گیگابایت VRAM HBM2e با پهنای باند 3.7 ترابایت بر ثانیه، 96 مگابایت حافظه نهان، رابط PCIe 5.0 x16 و استانداردهای رمزگشایی، کمابیش شبیه به بقیه به نظر می رسند.

تنها تفاوت در قدرت طراحی حرارتی است که برای هر دو مدل کارت OAM و PCIe 450 وات است. این کاهش قابل توجهی نسبت به مدل های دیگر است. PCIe HL-338 غیر چینی دارای TDP 600 وات است و فرم فاکتور OAM HL-325L و HL-335 دارای 900 وات است. TDP نسبتاً پایین در مدل های چینی Gaudi 3 احتمالاً دلیلی برای عدم وجود نسخه خنک کننده مایع است.

در حالی که به صراحت در کاغذ سفید ذکر نشده است، ایجاد تغییرات تقریباً برای مطابقت با آن ضروری است کنترل صادرات دولت آمریکا بر روی پردازنده ها، که شرکت های آمریکایی را از صادرات تراشه به چین بسته به عملکرد منع می کند. 

ما واقعاً نمی‌توانیم بدانیم که اینتل با Gaudi 3 چه کرده است تا با Gaudi 328 سازگار باشد و این تراشه‌های تایید شده برای چین با این تغییرات چقدر سریع عمل می‌کنند، اما سرنخ‌هایی وجود دارد. HL-388 و HL-3 همچنان از دو قالب مانند دیگر انواع Gaudi 4,800 استفاده می کنند، زیرا پیکربندی حافظه و حافظه پنهان بدون تغییر است. استفاده از دو قالب به جای یک قالب به کاهش چگالی عملکرد کمک می‌کند و به تراشه اجازه می‌دهد تا سقف صادراتی بالاتر یعنی XNUMX توان پردازش کل (TPP) را کاهش دهد.

منظور از محدودیت 4,800 TPP این است که هیچ تراشه ای نمی تواند 150 TFLOPS یا بیشتر از عملکرد 16 بیتی داشته باشد، و از آنجایی که Gaudi 3 می تواند تا 1,835 TFLOPS را در BF16 انجام دهد، اینتل باید عملکرد را به شدت کاهش دهد. این باید با یک برش واقعاً عظیم در شمارش هسته و سرعت ساعت یا برخی روش‌های محدودکننده عملکرد دیگر انجام شود.

ما از اینتل برای توضیح در مورد مدل های انحصاری گائودی 3 چین خواسته ایم و هنوز پاسخی نشنیده ایم. اگر اینتل اطلاعاتی را فاش کند، به‌روزرسانی خواهیم کرد.

احتمالاً می‌توان انتظار داشت که HL-328 و HL-388 عملکردی مشابه داشته باشند H20 انویدیا، سریعترین GPU سیلیکونی تیتان که برای فروش در چین تایید شده است. دارای 148 TFLOPS عملکرد FB16 و FP16، درست کمتر از حد مجاز 150-TFLOPS.

از آنجایی که عملکرد هسته خام بین مدل‌های H20 و مدل‌های چینی Gaudi 3 کمابیش برابر خواهد بود، تفاوت اصلی به حافظه برمی‌گردد، جایی که اینتل ظرفیت بیشتری دارد اما پهنای باند کمی کمتر دارد و نرم‌افزاری که همیشه یک نقطه فروش بوده است. برای تراشه های انویدیا ®

تمبر زمان:

بیشتر از ثبت نام