مجموعه VC مدعی دریافت اطلاعاتی در زمینه شتاب دهنده های گرافیکی AMD در زمینه پردازش های یادگیری عمیق (Deep Learning Accelerator) شده است. این اطلاعات در کنار برخی از اسلاید هایی است که مشخصات فنی این محصولات را نشان می دهد. ابتدا این مسئله را از نگاه تحلیلی مرور می کنیم؛ همه ی ما به خوبی میدانیم که پردازش های یادگیری عمیق و یادگیری ماشین را تنها شتاب دهنده هایی هندل می کنند که از توان عملیاتی بسیار بالایی برخوردار هستند. از این رو مطمئن هستیم که معماری AMD Polaris توان ورود به این مقوله را ندارد. با این وجود AMD در صحبت های خود بارها به این بازار پر سود اشاره کرده بود و شاید فکر میکردیم که منظورش پردازنده های سرور Naples است. اما ظاهرا اینطور نبوده و این کمپانی به دنبال ورود به بخش کامل پردازش های یادگیری عمیق است.
3 شتاب دهنده گرافیکی تحت عناوین MI6,MI8 و MI25 در این لیست وجود دارند؛ پرچمدار آنها نیز MI25 است. MI6 دارای توان عملیات مستقیم 5.7 ترافلاپ بر اساس پردازش های 32 بیتی (FP32) است. پهنای باند آن به 224 گیگابایت در ثانیه می رسد و توان حرارتی آن نیز 150 وات است. هر چند که از معماری MI6 و MI8 اطلاعاتی در دست نیست، اما این مشخصات بی شباهت به Polaris 10 نیست. MI8 نیز دارای توان عملیات مستقیم 8.2 ترافلاپ بوده و پهنای باند 512 گیگابایت در ثانیه را ارائه می دهد. توان حرارتی این شتاب دهنده نیز 175 وات است. این مشخصات نیز بی شباهت به یک کارت گرافیک مبتنی بر Fiji نیست. معماری فیجی همچنان پتانسیل حضور در بازار را داراست.
و اما گل سرسبد داستان، شتاب دهنده گرافیکی MI25 است که توانایی آن به 25 ترافلاپ در ثانیه می رسد و این توان بر اساس پردازش هایی به طول 16 بیت (FP16) اندازه گیری و اعلام شده است. همچنین شاهد توان عملیات مستقیم 12.5 ترافلاپ بر روی پردازش های 32 بیتی هستیم. همچنان توانایی این کارت گرافیک از پرچمداران Fiji بیشتر است. هر 3 شتاب دهنده به صورت منفعلانه و بدون فن تهویه می شوند که نکته ای بسیار جالب توجه است. شتاب دهنده MI25 تقریبا دو برابر سریعتر از کارت گرافیک Nvidia TITAN X 2015 یا تایتان مبتنی بر مکسول است. اما این پایان کار نیست؛ این کمپانی کامپیوترهایی را آماده کرده است که از پردازنده های AMD ZEN Naples در کنار شتاب دهنده های مورد نظر استفاده می کنند. این کامپیوترها به طور آماده برای سرور ها در نظر گرفته شده است. سرورهایی که از پردازش های عمیق برخوردار خواهند شد. در یکی از این کامپیوترهای پرچمدار، 120 تراشه گرافیکی MI25 نصب گشته است و توان عملیات مستقیم آن به 3 PFLOP می رسد. این توان بر اساس پردازش های FP16 اندازه گیری شده است. AMD بازار سرور و پردازش های عمیق را هدف قرار داده است؛ بازاری که حتی IBM از آن خارج شده و در دست Nvidia و Intel است.
25 ترافلاپ 😡
الان بنچمارک اون جلسه خصوص لو رفته بازی doom در کیفیت 4k تونسته 68 فریم بده بالاتر از 1080
یعنی حدود 6 ملیون واحد پردازنده دارن
یه نکته عجیب هست در مورد خبرای ای ام دی که بنچمارک هم دارن فقط به صورت فارسی مینویسن ولی برای انویدیا نداشته باشه هم میسازن