چیپ گرافیکی Aldebaran با معماری CDNA 2 به زودی در شتاب دهنده Instinct MI200 عرضه خواهد شد. این گرافیک از طراحی MCM (ماژول چند چیپ) بهره میبرد تا حجم عظیمی از هسته و حافظه را در خود جای دهد. با توجه به اطلاعاتی که از این گرافیک داریم، کاربر توییتر Locuza موفق شده بلاک دیاگرام چیپ AMD Aldebaran را به تصویر بکشد که واقعا یک جانور وحشی را نشان میدهد.
بلاک دیاگرام براساس آخرین جزئیاتیست که Kepler_L2 از این چیپ بر پایه معماری CDNA 2 به اشتراک گذاشته است. از قبل تایید شده بود که Aldebaran (یا شتاب دهنده Instinct MI200) از دو چیپ بهره میبرد. بلاک دیاگرام به تصویر کشیده شده نیز دو die را نشان میدهد که هر کدام 8 انجین سایه زن را برای جمع 16 عدد در خود جای دادهاند. هر Shader Engine حاوی 16 واحد محاسباتی با نرخ کامل Full-Rate FP64 و Packed FP32 و نسل دوم Matrix Engine برای عملیاتهای FP16 و BF16 است.
بلاک دیاگرام غیر رسمی چیپ AMD Aldebaran
هر die بالغ بر 128 واحد محاسباتی را شامل میشود که یعنی 8192 هسته. در نهایت ما شاهد 256 واحد محاسباتی یا 16384 هسته برای کل چیپ خواهیم بود. Aldebaran همچنین از یک اینترکانکت XGMI جدید بهره میبرد. هر چیپلت نیز از انجین VCN 2.6 و کنترلر اصلی ورودی / خروجی برخوردار است.
به سراغ بخش حافظه که برویم، AMD از رابط 8 کاناله با گذرگاههای 1024 بیتی استفاده کرده تا گذرگاه کلی 8192 بیت باشد. هر رابط میتواند ماژولهای 2 گیگابایتی HBM2e را پشتیبانی کند. یعنی تا 16 گیگابایت حافظه HBM2e به ازای هر پشته و از آنجایی که شاهد هشت پشته هستیم، جمع حافظه میتواند میزان بی نظیر 128 گیگابایت باشد. این میزان 48 گیگابایت بیشتر از چیپ A100 انویدیا با 80 گیگابایت حافظه HBM2e است. شتاب دهنده جدید AMD واقعا یک غول پردازشی در بحث HPC خواهد بود اما انتظار داریم توان مصرفی بسیار بالایی نیز داشته باشد. در عین حال Kepler_L2 ادعا میکند که شتاب دهنده Instinct MI200 در واقع از پیکربندی تقلیل یافته با 224 واحد محاسباتی یا 14336 هسته استفاده خواهد کرد. تقریبا 14 درصد هسته کمتر از چیپ کامل Aldebaran.
AMD Instinct MI200 شاید با نام دیگر Aldebaran شناخته شود که یکی از ستارههای غول پیکر صورت فلکی گاو (Taurus) با شعاع خورشیدی 44.13 یا 75 درصد بیشتر از Arcturus میباشد. نامگذاری نشان میدهد که شاید Aldebaran دو برابر قدرتمندتر از Arcturus باشد زیرا نام شتاب دهندههای MI معمولا نمایانگر عملکرد خام آنهاست. هر چند که فعلا این موضوع تنها یک حدس به شمار میرود اما با توجه به استفاده از طراحی MCM میتواند حقیقت داشته باشد.
در وصله قبلی لینوکس مشخص شده بود که AMD Instinct MI200 Aldebaran از حافظههای HBM2E پشتیبانی میکند. نسل جدید استاندارد حافظه که برای اولین با در چیپهای Nvidia Ampere GA100 استفاده شد و بهبود کارایی قابل توجهی نسبت به پیکربندی HBM2 حاضر در MI100 به همراه دارد. HBM2E میتواند در هر پشته تا 16 گیگابایت حجم را به همراه داشته باشد و این یعنی شاید Aldebaran به 64 گیگابایت حافظه HBM2E مجهز شود.
قابلیتهای لیست شده دیگر شامل پشتیبانی از SDMA یا System Direct Memory Access میباشد که اجازه میدهد دادهها از طریق زیر سیستمهای PCIe و XGMI/Infinity Cache انتقال یابند. به نظر میرسد که AMD طراحی جدید Infinity Cache را در شتاب دهنده بعدی Instinct استفاده خواهد کرد.
در نظر داشته باشید که AMD CDNA 2 با فناوری ساخت جدیدی تولید خواهد شد و تایید شده که از نسل سوم معماری AMD Infinity برای ارتباط 8 مسیره استفاده میکند. به نظر میرسد که MI200 برای رقابت با گرافیکهای نسل بعدی انویدیا (احتمالا Lovelace) در بازار HPC آماده میشود.
نام شتاب دهنده | AMD Radeon Instinct MI6 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI100 | AMD Radeon Instinct MI200 |
معماری گرافیک | Polaris 10 | Fiji XT | Vega 10 | Vega 20 | Vega 20 | Arcturus | Aldebaran؟ |
فناوری ساخت | 14 نانومتر FinFET | 28 نانومتر | 14 نانومتر FinFET | 7 نانومتر FinFET | 7 نانومتر FinFET | 7 نانومتر FinFET | فناوری ساخت پیشرفته |
هستههای پردازنده گرافیکی | 2304 | 4096 | 4096 | 3840 | 4096 | 7680 | 14336؟ |
فرکانس پردازنده گرافیکی | 1237 مگاهرتز | 1000 مگاهرتز | 1500 مگاهرتز | 1746 مگاهرتز | 1800 مگاهرتز | 1500مگاهرتز | نامشخص |
محاسبه FP16 | 5.7 ترافلاپ | 8.2 ترافلاپ | 24.6 ترافلاپ | 26.8 ترافلاپ | 29.6 ترافلاپ | 185 ترافلاپ | نامشخص |
محاسبه FP32 | 5.7 ترافلاپ | 8.2 ترافلاپ | 12.3 ترافلاپ | 13.4 ترافلاپ | 14.8 ترافلاپ | 23.1 ترافلاپ | نامشخص |
محاسبه FP62 | 384 گیگافلاپ | 512 گیگافلاپ | 768 گیگافلاپ | 6.7 ترافلاپ | 7.4 ترافلاپ | 11.5 ترافلاپ | نامشخص |
حافظه ویدیویی | 16 گیگابایت GDDR5 | 4 گیگابایت HBM` | 16 گیگابایت HBM2 | 16 گیگابایت HBM2 | 32 گیگابایت HBM2 | 32 گیگابایت HBM2 | 64 / 128 گیگابایت HBM2e؟ |
فرکانس حافظه | 1750 مگاهرتز | 500 مگاهرتز | 945 مگاهرتز | 1000 مگاهرتز | 1000 مگاهرتز | 1200 مگاهرتز | نامشخص |
گذرگاه حافظه | 256 بیت | 4096 بیت | 2048 بیت | 4096 بیت | 4096 بیت | 4096 بیت | 8192 بیت |
پهنای باند حافظه | 224 گیگابایت بر ثانیه | 512 گیگابایت بر ثانیه | 484 گیگابایت بر ثانیه | 1 ترابایت بر ثانیه | 1 ترابایت بر ثانیه | 1.23 ترابایت بر ثانیه | 2 ترابایت بر ثانیه؟ |
فرم فاکتور | تک اسلات طول کامل | دو اسلات طول نیمه | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل |
خنک کننده | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال |
توان حرارتی | 150 وات | 175 وات | 300 وات | 300 وات | 300 وات | 300 وات | نامشخص |
حتما توی FP32 حدود 50 ترافلاپ قدرت خواهند داشت ودر FP16 بالای 300 ترافلاپ .این دیگه چه غولیه البته مصرفش حتما بالای 400 واته