زمان معرفی Instinct MI100 با معماری CDNA که شتاب دهنده نسل بعدی کمپانی سرخ میباشد توسط Aroged تاریخ 16 نوامبر (26 آبان) اعلام شده است. این اطلاعات از اسنادی بدست آمده که مربوط به لاین آپ شتاب دهندههای نسل بعدی دیتاسنتر و HPC شرکت میباشند.
شتاب دهنده AMD Instinct MI100 تقریبا 5 ماه پیش توسط Mark Papermaster از AMD تایید شده بود. در آن زمان Mark ادعا کرد که آنها گرافیک Instinct بر پایه معماری CDNA را در نیمه دوم سال 2020 معرفی خواهند کرد. از آنجایی که به پایان سال نزدیک میشویم، به نظر میرسد AMD در نظر دارد تا قدرتمندترین گرافیک دیتاسنتر خود تا به حال را تحت رهبری مدیر جدید بخش RTG یعنی David Wang معرفی نماید.
زمان معرفی Instinct MI100 با معماری CDNA
Instinct MI100 همانطور که گفته شد از معماری نوین CDNA استفاده خواهد کرد که کاملا متفاوت از معماری RDNA برای گیمرهاست. معماری CDNA به شکل مخصوص برای HPC طراحی شده و به رقابت با Nvidia Ampere A100 و کارتهای شتاب دهنده مشابه خواهد پرداخت.
براساس شایعات مختلف ما میدانیم که چیپ گرافیکی Arcturus در Instinct MI100 از چندین نمونه استفاده میکند. مدل پرچمدار با کُد D34303 شناخته میشود که از نسخه XL بهره میبرد. اطلاعات این بخش براساس یک بُرد آزمایشی هستند و ممکن است مشخصات نهایی تغییرات فراوانی را پدید آورد.
- براساس چیپ گرافیکی Arcturus (نسل اول CDNA)
- بُرد آزمایشی توان حرارتی 200 واتی دارد (نسخههای نهایی 300 الی 350 وات)
- تا 32 گیگابایت حافظه HBM2e
مشخصات قبلی افشا شده توسط AdoredTV اشاره میکند که AMD Instinct MI100 از توان محاسباتی FP32 بالغ بر 34 ترافلاپ به ازای هر گرافیک بهره میبرد. هر گرافیک Instinct MI100 توان حرارتی 300 واتی خواهد داشت و همچنین 32 گیگابایت حافظه HBM2e در نظر گرفته شده تا پهنای باند کلی 1.225 ترابایت بر ثاینه را فراهم نماید.
نام شتاب دهنده | AMD Radeon Instinct MI6 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI100 |
معماری گرافیک | Polaris 10 | Fiji XT | Vega 10 | Vega 20 | Vega 20 | Arcturus |
فناوری ساخت | 14 نانومتر FinFET | 28 نانومتر | 14 نانومتر FinFET | 7 نانومتر FinFET | 7 نانومتر FinFET | 7 نانومتر FinFET |
هستههای پردازنده گرافیکی | 2304 | 4096 | 4096 | 3840 | 4096 | 8195? |
فرکانس پردازنده گرافیکی | 1237 مگاهرتز | 1000 مگاهرتز | 1500 مگاهرتز | 1746 مگاهرتز | 1800 مگاهرتز | 1334 مگاهرتز |
محاسبه FP16 | 5.7 ترافلاپ | 8.2 ترافلاپ | 24.6 ترافلاپ | 26.8 ترافلاپ | 29.6 ترافلاپ | 50 ترافلاپ؟ |
محاسبه FP32 | 5.7 ترافلاپ | 8.2 ترافلاپ | 12.3 ترافلاپ | 13.4 ترافلاپ | 14.8 ترافلاپ | 25 ترافلاپ؟ |
محاسبه FP62 | 384 گیگافلاپ | 512 گیگافلاپ | 768 گیگافلاپ | 6.7 ترافلاپ | 7.4 ترافلاپ | 12.5 ترافلاپ؟ |
حافظه ویدیویی | 16 گیگابایت GDDR5 | 4 گیگابایت HBM` | 16 گیگابایت HBM2 | 16 گیگابایت HBM2 | 32 گیگابایت HBM2 | 32 گیگابایت HBM2 |
فرکانس حافظه | 1750 مگاهرتز | 500 مگاهرتز | 472 مگاهرتز | 500 مگاهرتز | 500 مگاهرتز | نامشخص |
گذرگاه حافظه | 256 بیت | 4096 بیت | 2048 بیت | 4096 بیت | 4096 بیت | 4096 بیت |
پهنای باند حافظه | 224 گیگابایت بر ثانیه | 512 گیگابایت بر ثانیه | 484 گیگابایت بر ثانیه | 1 ترابایت بر ثانیه | 1 ترابایت بر ثانیه | نامشخص |
فرم فاکتور | تک اسلات طول کامل | دو اسلات طول نیمه | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل |
خنک کننده | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال؟ |
توان حرارتی | 150 وات | 175 وات | 300 وات | 300 وات | 300 وات | 300 وات؟ 200 وات (بُرد آزمایشی) |
در زمینه عملکرد AMD Radeon Instinct MI100 با شتاب دهندههای Nvidia Volta V100 و Nvidia Ampere A100 مقایسه شده. نکته جالب اینجاست که در اسلایدها به یک شتاب دهنده 300 واتی Ampere A100 اشاره شده است اگر چه چنین پیکربندی در حال حاضر وجود ندارد این یعنی ممکن است تنها شاهد یک پیکربندی فرضی از A100 باشیم زیرا این مدل در دو نسخه 400 واتی با فرم فاکتور SXM و 250 واتی با فرم فاکتور PCI Express ارائه شده.
جدیدترین بنچمارک Radeon Instinct MI100 عملکردی تا 13 درصد بهتر نسبت به Ampere A100 و تا 2 برابر بهتر نسبت به Volta V100 را در FP32 نشان میدهد. میزان عملکرد به ارزش نیز مقایسه شده که MI100 تا 2.4 برابر ارزش بیشتری نسبت به V100S و تا 50 درصد بهتر از Ampere A100 را نشان میدهد. همچنین نشان داده شده که مقیاس عملکرد حتی در پیکربندی 32 گرافیک نیز بسیار عالیست.
همچنین در این اسلایدها اشاره شده که AMD عملکرد و ارزش بسیار بهتری را در سه دسته نفت و گاز، آکادمیک، HPC و یادگیری ماشین ارائه میدهد. در باقی موارد یعنی محاسبات FP64، هوش مصنوعی و تجزیه و تحلیل دادهها انویدیا با شتاب دهنده A100 خود پیشتاز است. همچنین تیم سبز 2.5 برابر عملکرد بهتر در FP64، تا 2 برابر عملکرد بهتر در FP16 و دو برابر عملکرد بهتر Tensor را با گرافیک Ampere A100 فراهم میکند.
به علاوه Instinct MI100 ظاهرا تیم سرخ برنامه دارد تا شتاب دهندههای Instinct V640 و Instinct V620 را نیز معرفی نماید. مشخصات این مدلها در حال حاضر در دسترس نیست اما احتمالا به زودی جزئیات بیشتری از آنها خواهیم شنید. همچنین به نظر میرسد AMD برند Radeon را از کارتهای CDNA حذف کرده تا نام گذاری بهتری را نیز شاهد باشیم.
AMD ثابت کرده که میتواند قدرت محاسباتی خام بیشتری را در قیمت رقابتی ارائه دهد و شاید Arcturus نیز همین موضوع را هدف گرفته. با توجه به عرضه نه چندان دور Instinct MI100 ما به زودی شاهد خواهیم بود که تا چه اندازه قادر به رقابت با شتاب دهنده A100 انویدیا میباشد.
بیشتر بخوانید: بنچمارک های بیشتر از Radeon RX 6000 توسط AMD منتشر شد
همونطور که در بحث پیشین گفتم، انویدیا آمپر رو با دو هدف ورک استیشن و بازی (بیشتر به نفع ورک استیشن) توسعه داده. الان میبینیم که رویکرد AMD کاملا متفاوت هست و دو معماری مجازی برای دو هدف متفاوت استفاده کرده. به طور مشخص بخوام بگم، گرافیک های بازی انویدیا به خاطر چنین رویکردی بهتر از رقیب در کاربردهای ورک استیشن عمل کنند در حالیکه در گذشته تقریبا برعکس بود.
RDNA و RDNA2 اصولا ظرفیت اینو نداره که با اسکیل کردن اون، تبدیل گرافیک اختصاصی ورک استیشن بشه. برای همین هم AMD چنین رویکردی رو پیش گرفته که البته رویکرد مناسبی هست.
یکم خفنه از نظر من