در طی ماههای گذشته شاهد گزارشات مختلفی درباره پیشرفتهای جدید در فناوری پردازنده و گرافیک از سوی AMD بودهایم. به نظر میرسد این شرکت قصد دارد با عرضه شتاب دهنده Instinct MI200 در پایان 2021 معماری CDNA 2 را خیلی سریع به بازار HPC وارد کند. این اطلاعات البته از آخرین نشست با سرمایه گذاران بدست آمده که اوایل همین ماه میلادی برگزار شده بود. در عین حال تصور میشود که معماری CDNA 2 از طراحی MCM استفاده خواهد کرد.
برخلاف ماه مِی، گزارش جدید منتشر شده در پایان ماه جولای نشان میدهد که AMD در نظر دارد تا معماری CDNA 2 خود را تا پایان سال 2021 در بازار ارائه کند. این شتاب دهنده از فناوری ساخت پیشرفتهای بهره میبرد که احتمالا متعلق به TSMC بوده و شاید نود 6 یا 7 نانومتری باشد.
- گرافیک های Navi 31 و Navi 33 در پلتفرم ROCm لیست شدند
- سهم بازار پردازنده AMD به نزدیک 17 درصد رسید – بالاترین میزان از سال 2006
- درایور جدید AMD با رفع مشکل مصرف انرژی بالا در یوتیوب
عرضه شتاب دهنده Instinct MI200 در پایان 2021
معماری CDNA 2 نیرو بخش شتاب دهندههای آینده Instinct HPC تیم سرخ خواهد بود. مدلهایی مانند Instinct MI200 که انتظار میرود از پردازنده گرافیکی Aldebaran بهره ببرد. همانطور که گفتیم این کارت گرافیک احتمالا اولین نمونهای خواهد بود که به شکل ماژول چند چیپ ارائه میشود. Instinct MI200 برای رقابت با Ponte Vecchio (شتاب دهنده 7 نانومتری) اینتل و همچنین معماری بهبود یافته Ampere انویدیا آماده میشود. البته که دو تیم سبز و آبی نیز مدلهای MCM خود را عرضه خواهند کرد.
از قبل تایید شده بود که Aldebaran (یا شتاب دهنده Instinct MI200) از دو چیپ بهره میبرد. بلاک دیاگرام به تصویر کشیده شده نیز دو die را نشان میدهد که هر کدام 8 انجین سایه زن را برای جمع 16 عدد در خود جای دادهاند. هر Shader Engine حاوی 16 واحد محاسباتی با نرخ کامل Full-Rate FP64 و Packed FP32 و نسل دوم Matrix Engine برای عملیاتهای FP16 و BF16 است.
هر die بالغ بر 128 واحد محاسباتی را شامل میشود که یعنی 8192 هسته. در نهایت ما شاهد 256 واحد محاسباتی یا 16384 هسته برای کل چیپ خواهیم بود. Aldebaran همچنین از یک اینترکانکت XGMI جدید بهره میبرد. هر چیپلت نیز از انجین VCN 2.6 و کنترلر اصلی ورودی / خروجی برخوردار است.
به سراغ بخش حافظه که برویم، AMD از رابط 8 کاناله با گذرگاههای 1024 بیتی استفاده کرده تا گذرگاه کلی 8192 بیت باشد. هر رابط میتواند ماژولهای 2 گیگابایتی HBM2e را پشتیبانی کند. یعنی تا 16 گیگابایت حافظه HBM2e به ازای هر پشته و از آنجایی که شاهد هشت پشته هستیم، جمع حافظه میتواند میزان بی نظیر 128 گیگابایت باشد. این میزان 48 گیگابایت بیشتر از چیپ A100 انویدیا با 80 گیگابایت حافظه HBM2e است. شتاب دهنده جدید AMD واقعا یک غول پردازشی در بحث HPC خواهد بود اما انتظار داریم توان مصرفی بسیار بالایی نیز داشته باشد. در عین حال Kepler_L2 ادعا میکند که شتاب دهنده Instinct MI200 در واقع از پیکربندی تقلیل یافته با 224 واحد محاسباتی یا 14336 هسته استفاده خواهد کرد. تقریبا 14 درصد هسته کمتر از چیپ کامل Aldebaran.
AMD Instinct MI200 شاید با نام دیگر Aldebaran شناخته شود که یکی از ستارههای غول پیکر صورت فلکی گاو (Taurus) با شعاع خورشیدی 44.13 یا 75 درصد بیشتر از Arcturus میباشد. نامگذاری نشان میدهد که شاید Aldebaran دو برابر قدرتمندتر از Arcturus باشد زیرا نام شتاب دهندههای MI معمولا نمایانگر عملکرد خام آنهاست. هر چند که فعلا این موضوع تنها یک حدس به شمار میرود اما با توجه به استفاده از طراحی MCM میتواند حقیقت داشته باشد.
نام شتاب دهنده | AMD Radeon Instinct MI6 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI100 | AMD Radeon Instinct MI200 |
معماری گرافیک | Polaris 10 | Fiji XT | Vega 10 | Vega 20 | Vega 20 | Arcturus | Aldebaran؟ |
فناوری ساخت | 14 نانومتر FinFET | 28 نانومتر | 14 نانومتر FinFET | 7 نانومتر FinFET | 7 نانومتر FinFET | 7 نانومتر FinFET | فناوری ساخت پیشرفته |
هستههای پردازنده گرافیکی | 2304 | 4096 | 4096 | 3840 | 4096 | 7680 | 14336؟ |
فرکانس پردازنده گرافیکی | 1237 مگاهرتز | 1000 مگاهرتز | 1500 مگاهرتز | 1746 مگاهرتز | 1800 مگاهرتز | 1500مگاهرتز | نامشخص |
محاسبه FP16 | 5.7 ترافلاپ | 8.2 ترافلاپ | 24.6 ترافلاپ | 26.8 ترافلاپ | 29.6 ترافلاپ | 185 ترافلاپ | نامشخص |
محاسبه FP32 | 5.7 ترافلاپ | 8.2 ترافلاپ | 12.3 ترافلاپ | 13.4 ترافلاپ | 14.8 ترافلاپ | 23.1 ترافلاپ | نامشخص |
محاسبه FP62 | 384 گیگافلاپ | 512 گیگافلاپ | 768 گیگافلاپ | 6.7 ترافلاپ | 7.4 ترافلاپ | 11.5 ترافلاپ | نامشخص |
حافظه ویدیویی | 16 گیگابایت GDDR5 | 4 گیگابایت HBM` | 16 گیگابایت HBM2 | 16 گیگابایت HBM2 | 32 گیگابایت HBM2 | 32 گیگابایت HBM2 | 64 / 128 گیگابایت HBM2e؟ |
فرکانس حافظه | 1750 مگاهرتز | 500 مگاهرتز | 945 مگاهرتز | 1000 مگاهرتز | 1000 مگاهرتز | 1200 مگاهرتز | نامشخص |
گذرگاه حافظه | 256 بیت | 4096 بیت | 2048 بیت | 4096 بیت | 4096 بیت | 4096 بیت | 8192 بیت |
پهنای باند حافظه | 224 گیگابایت بر ثانیه | 512 گیگابایت بر ثانیه | 484 گیگابایت بر ثانیه | 1 ترابایت بر ثانیه | 1 ترابایت بر ثانیه | 1.23 ترابایت بر ثانیه | 2 ترابایت بر ثانیه؟ |
فرم فاکتور | تک اسلات طول کامل | دو اسلات طول نیمه | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل |
خنک کننده | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال |
توان حرارتی | 150 وات | 175 وات | 300 وات | 300 وات | 300 وات | 300 وات | نامشخص |
دیدگاهتان را بنویسید