cبه زودی شاهد معرفی شتاب دهنده AMD Instinct MI200 خواهیم بود که اولین گرافیک دسته HPC با طراحی MCM بر پایه معماری CDNA 2 میباشد. به نظر میرسد این گرافیک عملکرد دیوانه واری را در مقایسه با Instinct MI100 فعلی ارائه خواهد داد، جایی که چهار برابر افزایش کارایی محاسبات FP16 را شاهد خواهیم بود.
ما در طول چند وقت اخیر اکثر مشخصات شتاب دهنده Instinct MI200 را بدست آوردهایم اما کارایی کلی آن تا به امروز یک راز باقی مانده بود. حالا افشاگر معروف ExecutableFix اولین معیار عملکرد گرافیک CDNA 2 با طراحی MCM را به اشتراک گذاشته تا شاهد یک هیولا باشیم.
- بنچمارک Ryzen Threadripper 5975WX – سریعتر از 3990X
- پردازنده 8 هسته ای Ryzen Rembrandt مشاهده شد – RDNA 2 و DDR5
- پردازنده های Ryzen 7000 Raphael H – تا 16 هسته Zen 4 در نوت بوکها
- احتمال همراه شدن شتاب دهنده AMD Instinct MI300 به گرافیک Quad MCM
شتاب دهنده AMD Instinct MI200
با توجه به توییت ExecutableFix، مدل Instinct MI200 سرعت کلاکی تا 1.7 گیگاهرتز خواهد داشت که 13 درصد بیشتر از Instinct MI100 میباشد. این گرافیک دو برابر پردازنده جریانی بیشتر (14080) در 220 واحد محاسباتی را در اختیار دارد. در حالی که انتظار داشتیم این تعداد 240 واحد محاسباتی و 15360 هسته باشد ظاهرا به علت بازده تولید بیشتر نمونهای تقلیل یافته عرضه خواهد شد. با این اوصاف ممکن است که در آینده مدلی با چیپ کامل و کارایی بالاتر نیز عرضه شود.
از نظر کارایی، شتاب دهنده AMD Instinct MI200 تقریبا 50 ترافلاپ (به شکل دقیق 47.9) عملکرد FP64 و FP32 ارائه میدهد. در مقایسه با Instinct MI100 شاهد افزایش 4.16 برابری در FP64 هستیم. در حقیقت اعداد مربوط به محاسبات FP64 مدل Instinct MI200 حتی از عملکرد FP32 نمونه قبلی نیز عبور میکند. به اعداد FP16 و BF16 که برسیم عملکرد دیوانه وار 383 ترافلاپ را شاهد خواهیم بود. برای مقایسه MI100 تنها 92.3 ترافلاپ عملکرد BFloat16 و 184.6 ترافلاپ کارایی FP16 را در اختیار دارد.
همانطور که HPCWire اعلام کرده، Instinct MI200 نیرو بخش سه ابرکامپیوتر فوق بالا رده خواهد بود که شامل Frontier ایالات متحده، LUMI اتحادیه اروپا و Setonix استرالیا خواهد بود. رقیب این کارت شامل A100 80GB با قدرت محاسباتی 19.5 ترافلاپ در FP64 و 156 ترافلاپ در FP32 و 312 ترافلاپ در FP16 میباشد. البته انتظار داریم که انویدیا نیز خیلی زود گرافیکی با طراحی MCM در سال 2022 ارائه کند.
معماری CDNA 2 نیرو بخش شتاب دهندههای آینده Instinct HPC تیم سرخ خواهد بود. مدلهایی مانند Instinct MI200 که انتظار میرود از پردازنده گرافیکی Aldebaran بهره ببرد. همانطور که گفتیم این کارت گرافیک احتمالا اولین نمونهای خواهد بود که به شکل ماژول چند چیپ ارائه میشود. Instinct MI200 برای رقابت با Ponte Vecchio (شتاب دهنده 7 نانومتری) اینتل و همچنین معماری بهبود یافته Ampere انویدیا آماده میشود. البته که دو تیم سبز و آبی نیز مدلهای MCM خود را عرضه خواهند کرد.
از قبل تایید شده بود که Aldebaran (یا شتاب دهنده Instinct MI200) از دو چیپ بهره میبرد. بلاک دیاگرام به تصویر کشیده شده نیز دو die را نشان میدهد که هر کدام 8 انجین سایه زن را برای جمع 16 عدد در خود جای دادهاند. هر Shader Engine حاوی 16 واحد محاسباتی با نرخ کامل Full-Rate FP64 و Packed FP32 و نسل دوم Matrix Engine برای عملیاتهای FP16 و BF16 است.
هر die بالغ بر 128 واحد محاسباتی را شامل میشود که یعنی 8192 هسته. در نهایت ما شاهد 256 واحد محاسباتی یا 16384 هسته برای کل چیپ خواهیم بود. Aldebaran همچنین از یک اینترکانکت XGMI جدید بهره میبرد. هر چیپلت نیز از انجین VCN 2.6 و کنترلر اصلی ورودی / خروجی برخوردار است.
به سراغ بخش حافظه که برویم، AMD از رابط 8 کاناله با گذرگاههای 1024 بیتی استفاده کرده تا گذرگاه کلی 8192 بیت باشد. هر رابط میتواند ماژولهای 2 گیگابایتی HBM2e را پشتیبانی کند. یعنی تا 16 گیگابایت حافظه HBM2e به ازای هر پشته و از آنجایی که شاهد هشت پشته هستیم، جمع حافظه میتواند میزان بی نظیر 128 گیگابایت باشد. این میزان 48 گیگابایت بیشتر از چیپ A100 انویدیا با 80 گیگابایت حافظه HBM2e است. شتاب دهنده جدید AMD واقعا یک غول پردازشی در بحث HPC خواهد بود اما انتظار داریم توان مصرفی بسیار بالایی نیز داشته باشد. در عین حال Kepler_L2 ادعا میکند که شتاب دهنده Instinct MI200 در واقع از پیکربندی تقلیل یافته با 224 واحد محاسباتی یا 14336 هسته استفاده خواهد کرد. تقریبا 14 درصد هسته کمتر از چیپ کامل Aldebaran.
AMD Instinct MI200 شاید با نام دیگر Aldebaran شناخته شود که یکی از ستارههای غول پیکر صورت فلکی گاو (Taurus) با شعاع خورشیدی 44.13 یا 75 درصد بیشتر از Arcturus میباشد. نامگذاری نشان میدهد که شاید Aldebaran دو برابر قدرتمندتر از Arcturus باشد زیرا نام شتاب دهندههای MI معمولا نمایانگر عملکرد خام آنهاست. هر چند که فعلا این موضوع تنها یک حدس به شمار میرود اما با توجه به استفاده از طراحی MCM میتواند حقیقت داشته باشد.
نام شتاب دهنده | AMD Radeon Instinct MI6 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI100 | AMD Radeon Instinct MI200 | AMD Radeon Instinct MI300 |
معماری گرافیک | Polaris 10 | Fiji XT | Vega 10 | Vega 20 | Vega 20 | Arcturus | Aldebaran | نامشخص (CDNA 3) |
فناوری ساخت | 14 نانومتر FinFET | 28 نانومتر | 14 نانومتر FinFET | 7 نانومتر FinFET | 7 نانومتر FinFET | 7 نانومتر FinFET | فناوری ساخت پیشرفته | فناوری ساخت پیشرفته |
هستههای پردازنده گرافیکی | 2304 | 4096 | 4096 | 3840 | 4096 | 7680 | 14080؟ | 28160؟ |
فرکانس پردازنده گرافیکی | 1237 مگاهرتز | 1000 مگاهرتز | 1500 مگاهرتز | 1746 مگاهرتز | 1800 مگاهرتز | 1500مگاهرتز | 1700مگاهرتز | نامشخص |
محاسبه FP16 | 5.7 ترافلاپ | 8.2 ترافلاپ | 24.6 ترافلاپ | 26.8 ترافلاپ | 29.6 ترافلاپ | 185 ترافلاپ | 383 ترافلاپ | نامشخص |
محاسبه FP32 | 5.7 ترافلاپ | 8.2 ترافلاپ | 12.3 ترافلاپ | 13.4 ترافلاپ | 14.8 ترافلاپ | 23.1 ترافلاپ | 95.8 ترافلاپ | نامشخص |
محاسبه FP62 | 384 گیگافلاپ | 512 گیگافلاپ | 768 گیگافلاپ | 6.7 ترافلاپ | 7.4 ترافلاپ | 11.5 ترافلاپ | 47.9 ترافلاپ | نامشخص |
حافظه ویدیویی | 16 گیگابایت GDDR5 | 4 گیگابایت HBM` | 16 گیگابایت HBM2 | 16 گیگابایت HBM2 | 32 گیگابایت HBM2 | 32 گیگابایت HBM2 | 64 / 128 گیگابایت HBM2e؟ | نامشخص |
فرکانس حافظه | 1750 مگاهرتز | 500 مگاهرتز | 945 مگاهرتز | 1000 مگاهرتز | 1000 مگاهرتز | 1200 مگاهرتز | نامشخص | نامشخص |
گذرگاه حافظه | 256 بیت | 4096 بیت | 2048 بیت | 4096 بیت | 4096 بیت | 4096 بیت | 8192 بیت | نامشخص |
پهنای باند حافظه | 224 گیگابایت بر ثانیه | 512 گیگابایت بر ثانیه | 484 گیگابایت بر ثانیه | 1 ترابایت بر ثانیه | 1 ترابایت بر ثانیه | 1.23 ترابایت بر ثانیه | 2 ترابایت بر ثانیه؟ | نامشخص |
فرم فاکتور | تک اسلات طول کامل | دو اسلات طول نیمه | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل | نامشخص |
خنک کننده | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال | نامشخص |
توان حرارتی | 150 وات | 175 وات | 300 وات | 300 وات | 300 وات | 300 وات | نامشخص | نامشخص |
دیدگاهتان را بنویسید