اعداد و جزئیات گرافیک بر پایه معماری CDNA نسل بعدی AMD افشا شده و در واقع ما حالا جدیدترین بنچمارک Radeon Instinct MI100 را توسط AdoredTV در اختیار داریم. AdoredTV در پستی اختصاصی بنچمارک عملکرد گرافیک HPC تیم را با گرافیکهای Volta و Ampere از تیم سبز مقایسه نموده است.
AdoredTV اعا میکند که اسلایدهایی که دریافت کرده از ارائه رسمی AMD Radeon Instinct MI100 میباشند. در گزارشهای قبلی تایید کرده بودیم که گرافیک Radeon Instinct MI100 در نیمه دوم سال 2020 به بازار عرضه خواهد شد. اسلایدهای AdoredTV حالا جزئیات بیشتری از برنامهها و پیکربندیهای سروری که از AMD و شرکای آن در سال 2020 و فراتر از آن انتظار میرود را در اختیار داریم.
جدیدترین بنچمارک Radeon Instinct MI100
مشخصات سرور AMD Radeon Instinct MI100 1U
در ابتدا AMD برنامه دارد تا یک سرور مخصوص HPC با طراحی 2P با دو پردازنده AMD EPYC با معاری Rome یا Milan معرفی نماید. هر پردازنده EPYC به دو شتاب دهنده Radeon Instinct MI100 از طریق نسل دوم اینترکانکت Infinity Fabric متصل خواهد شد. چهار گرافیک قادر خواهند بود 136 ترافلاپ خروجی FP32 را ارائه دهند که به 34 ترافلاپ محاسبات FP32 برای هر گرافیک ترجمه میشود. هر گرافیک Radeon Instinct MI100 توان مصرفی 300 واتی خواهد داشت.
مشخصات دیگر شامل پهنای باند کلی PCIe است که 256 گیگابایت بر ثانیه و احتمالا بر پایه پروتکل نسل چهارم میباشد. ترکیب پهنای باند حافظه چهار گرافیک 4.9 ترابایت بر ثانیه را شکل خواهد داد که یعنی AMD از ماژولهای HBM2e استفاده کرده (هر گرافیک 1.225 ترابایت بر ثانیه پهنای باند خواهد داشت). ترکیب حافظه حجم 128 گیگابایت یا 32 گیگابایت برای هر گرافیک را نشان میدهد. احتمالا تیم سرخ از 4 حافظه HBM2 که هر کدام 8 چیپ را در خود پشته سازی کردهاند، استفاده نموده.
در بحث زمان عرضه سرور 1U با پردازندههای AMD EPYC Rome / Milan احتمالا در دسامبر 2020 عرضه خواهد شد در حالی که یک نمونه Intel Xeon نیز در فوریه 2021 منتشر میشود.
مشخصات سرور AMD Radeon Instinct MI100 3U
سرور دوم 3U انتظار میرود که در مارس 2021 به بازار عرضه شود در حالی که مشخصات بسیار قدرتمندتری مانند 8 گرافیک Radeon Instinct MI100 متصل به دو چیپ EPYC را شامل میشود. هر گروه چهارتایی Instinct MI100 از طریق یک XGMI به یکدیگر متصل هستند. چهار شتاب دهنده قدرت محاسباتی F32 بالغ بر 272 ترافلاپ، 512 گیگابایت بر ثانیه پهنای باند PCIe، تا 9.8 ترابایت بر ثانیه پهنای باند HBM و 256 گیگابایت حافظه DRAM را تشکیل میدهند. تمام مجموعه مصرفی 3 کیلوواتی خواهد داشت.
نام شتاب دهنده | AMD Radeon Instinct MI6 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI100 |
معماری گرافیک | Polaris 10 | Fiji XT | Vega 10 | Vega 20 | Vega 20 | Arcturus |
فناوری ساخت | 14 نانومتر FinFET | 28 نانومتر | 14 نانومتر FinFET | 7 نانومتر FinFET | 7 نانومتر FinFET | 7 نانومتر FinFET |
هستههای پردازنده گرافیکی | 2304 | 4096 | 4096 | 3840 | 4096 | 8195? |
فرکانس پردازنده گرافیکی | 1237 مگاهرتز | 1000 مگاهرتز | 1500 مگاهرتز | 1746 مگاهرتز | 1800 مگاهرتز | 1334 مگاهرتز |
محاسبه FP16 | 5.7 ترافلاپ | 8.2 ترافلاپ | 24.6 ترافلاپ | 26.8 ترافلاپ | 29.6 ترافلاپ | 50 ترافلاپ؟ |
محاسبه FP32 | 5.7 ترافلاپ | 8.2 ترافلاپ | 12.3 ترافلاپ | 13.4 ترافلاپ | 14.8 ترافلاپ | 25 ترافلاپ؟ |
محاسبه FP62 | 384 گیگافلاپ | 512 گیگافلاپ | 768 گیگافلاپ | 6.7 ترافلاپ | 7.4 ترافلاپ | 12.5 ترافلاپ؟ |
حافظه ویدیویی | 16 گیگابایت GDDR5 | 4 گیگابایت HBM` | 16 گیگابایت HBM2 | 16 گیگابایت HBM2 | 32 گیگابایت HBM2 | 32 گیگابایت HBM2 |
فرکانس حافظه | 1750 مگاهرتز | 500 مگاهرتز | 472 مگاهرتز | 500 مگاهرتز | 500 مگاهرتز | نامشخص |
گذرگاه حافظه | 256 بیت | 4096 بیت | 2048 بیت | 4096 بیت | 4096 بیت | 4096 بیت |
پهنای باند حافظه | 224 گیگابایت بر ثانیه | 512 گیگابایت بر ثانیه | 484 گیگابایت بر ثانیه | 1 ترابایت بر ثانیه | 1 ترابایت بر ثانیه | نامشخص |
فرم فاکتور | تک اسلات طول کامل | دو اسلات طول نیمه | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل | دو اسلات طول کامل |
خنک کننده | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال | غیر فعال؟ |
توان حرارتی | 150 وات | 175 وات | 300 وات | 300 وات | 300 وات | 300 وات؟ 200 وات (بُرد آزمایشی) |
در زمینه عملکرد AMD Radeon Instinct MI100 با شتاب دهندههای Nvidia Volta V100 و Nvidia Ampere A100 مقایسه شده. نکته جالب اینجاست که در اسلایدها به یک شتاب دهنده 300 واتی Ampere A100 اشاره شده است اگر چه چنین پیکربندی در حال حاضر وجود ندارد این یعنی ممکن است تنها شاهد یک پیکربندی فرضی از A100 باشیم زیرا این مدل در دو نسخه 400 واتی با فرم فاکتور SXM و 250 واتی با فرم فاکتور PCI Express ارائه شده.
جدیدترین بنچمارک Radeon Instinct MI100 عملکردی تا 13 درصد بهتر نسبت به Ampere A100 و تا 2 برابر بهتر نسبت به Volta V100 را در FP32 نشان میدهد. میزان عملکرد به ارزش نیز مقایسه شده که MI100 تا 2.4 برابر ارزش بیشتری نسبت به V100S و تا 50 درصد بهتر از Ampere A100 را نشان میدهد. همچنین نشان داده شده که مقیاس عملکرد حتی در پیکربندی 32 گرافیک نیز بسیار عالیست.
همچنین در این اسلایدها اشاره شده که AMD عملکرد و ارزش بسیار بهتری را در سه دسته نفت و گاز، آکادمیک، HPC و یادگیری ماشین ارائه میدهد. در باقی موارد یعنی محاسبات FP64، هوش مصنوعی و تجزیه و تحلیل دادهها انویدیا با شتاب دهنده A100 خود پیشتاز است. همچنین تیم سبز 2.5 برابر عملکرد بهتر در FP64، تا 2 برابر عملکرد بهتر در FP16 و دو برابر عملکرد بهتر Tensor را با گرافیک Ampere A100 فراهم میکند.
یکی از نکات دیگر نیز عدم اشاره AMD به اعداد Sparsity انویدیا در بنچمارکهاست. با Sparsity شتاب دهنده A100 قادر است تا 156 ترافلاپ عملکرد محاسباتی را ارائه دهد اما ظاهرا تیم سرخ تنها قصد داشته یک مقایسه کلی با A100 را به انجام رساند. ظاهرا Radeon Instinct MI100 یک مدل عالی HPC خواهد بود که عملکرد و ارزش بالایی را در زمان عرضه ارائه میدهد.
بیشتر بخوانید: گرافیک Arcturus بر پایه معماری CDNA مشاهده شد – 7680 هسته و HBM2
دیدگاهتان را بنویسید