AMD از یک معامله بزرگ دیگر در بازار HPC خبر داد. پردازندههای نسل بعدی EPYC (در واقع دو نسل بعد) و شتاب دهندههای Radeon نیرو بخش ابر کامپیوتر El Capitan با توان خارق العاده 2 اگزافلاپ خواهند بود. این ابر کامپیوتر متعلق به وزارت انرژی ایالات متحده (DOE) میباشد و قرار است در سال 2023 فعالیت خود را شروع کند.
هر سه غول صنعت یعنی اینتل، انویدیا و AMD برای عقد قرارداد جدیدترین ابر کامپیوتر وزارت انرژی رقابت میکردند اما به نظر میرسد تیم سرخ موفق شده در هر دو بخش پردازنده مرکزی و گرافیک برنده شود. ابر کامپیوتر El Capitan توسط شرکت Cray که زیر مجموعه HPE (همان HP) است ساخته خواهد شد که از شتاب دهندههای AMD برای زنده کردن این هیولای اگزافلاپی بهره خواهد گرفت. این ابر کامپیوتر در آزمایشگاه ملی Lawrence Livermore فعالیت خواهد کرد و قادر است تا 2 کوینتیلیون محاسبه بر ثانیه را انجام دهد.
ما انتظار داریم زمانی که به آزمایشگاه در سال 2023 تحویل داده شود، سریعترین ابر کامپیوتر در دنیا لقب گیرد.
Bill Goldstein مدیر آزمایشگاه Livermore
قدرت 2 اگزافلاپی El Capitan
تمام این سیستم هزینهای 600 میلیون دلاری خواهد داشت و حداقل 16 برابر سریعتر از ابر کامپیوتر Sierra (با ترکیب IBM Power 9 + Nvidia Volta) که در حال حاضر در همین آزمایشگاه فعال است، خواهد بود. در بحث مشخصات سیستم میدانیم که پردازندههای EPYC Genoa با هستههای Zen 4 و همچنین شتاب دهندههای نسل بعدی Radeon Instinct برای بخش گرافیکی در آن حضور دارند. تمام سیستم نیز توانی کمتر از 40 مگاوات را زمانی که عملیاتی شود مصرف خواهد کرد.
برخی از تکنولوژیهای AMD که در ابر کامپیوتر El Capitan استفاده میشوند:
- پردازندههای نسل بعدی AMD EPYC با اسم رمز Genoa و هستههای Zen 4. این پردازندهها از حافظهها و زیر سیستمهای ورودی / خروجی نسل بعد برای هوش مصنوعی و بارهای کاری HPC پشتیبانی میکنند.
- نسل بعدی گرافیکهای Radeon Instinct بر اساس یک معماری بهینه شده محاسباتی برای بارهای کاری مختلف مانند HPC و AI. این گرافیکها از حافظههای با پهنای باند بالا نسل بعد استفاده میکنند و طراحی شدهاند تا عملکردی بهینه برای یادگیری عمیق داشته باشند.
- معماری نسل سوم AMD Infinity که ارتباطی با پهنای باند بالا و تاخیر پایین را بین چهار گرافیک Radeon Instinct و یک پردازنده AMD EPYC که در هر نود El Capitan وجود دارند، بر قرار میکنند. معماری نسل سوم AMD Infinity همچنین شامل حافظه یکپارچه بین پردازنده و گرافیک میشود تا برنامه نویسان دسترسی راحتتری به محاسبات شتاب یافته داشته باشند.
- نسخه بهبود یافته محیط برنامه نویسی ناهمگون و متن باز ROCm که توسعه یافته تا کارایی پردازندهها و گرافیکهای AMD را ترکیب کرده و حداکثر عملکرد را فعال کند.
پردازندههای AMD EPYC Genoa با هستههای Zen 4
پردازندههای AMD EPYC Genoa براساس معماری Zen 4 خواهند بود که در واقع تا زمان معرفی رسمی توسط تیم سرخ در آخرین نقشه راه شرکت، یک راز باقی مانده بودند. در حال حاضر این معماری در فاز طراحی قرار دارد و برای عرضه در سال 2021 در نظر گرفته شده؛ لاین آپ Genoa قابلیتهای جدیدی را فراهم میکند تا دورنمای تازهای برای سرورها ایجاد شود.
AMD اعلام کرده که EPYC Genoa با پلتفرم جدید SP5 سازگار خواهد بود که از سوکت جدیدی استفاده خواهد کرد، بنابراین سازگاری با SP3 تنها تا مدلهای EPYC Milan ادامه دارد. پردازندههای EPYC Genoa احتمالا از حافظهها و تواناییهای جدیدی پشتیبانی میکنند. به نظر میرسد AMD بدون شک به سمت پشتیبانی از DDR5 در 2021 پیش خواهد رفت. از آن جایی که DDR5 با Zen 4 همراه میشود، احتمال دارد سری AMD Ryzen و Threadripper نیز از این استاندارد جدید حافظه پشتیبانی کنند. همچنین اعلام شده تواناییهای جدیدی با EPYC Genoa معرفی خواهد شد که ظاهرا به پروتکل PCI Express 5.0 اشاره میکند. رابط جدیدی که پهنای باند دو برابری نسبت به PCIe 4.0 یعنی 128Gbps در یک رابط x16 را فراهم میکند.
در نگاه کلی چیپهای آینده EPYC Genoa قابلیتهای اصلی زیر را خواهند داشت:
- هستههای Zen 4 با فناوری پس از 7 نانومتر
- پلتفرم SP5 با سوکت جدید
- پشتیبانی PCI Express 5.0
- پشتیبانی از حافظه DDR5
- عرضه در سال 2021
نقشه راه پردازنده AMD
خانواده Ryzen | سری رایزن 1000 | سری رایزن 2000 | سری رایزن 3000 | سری رایزن 4000 | سری رایزن 5000 |
معماری | Zen | ZenZen+ | Zen 2 | Zen 3 | Zen 4 |
فناوری | 14 نانومتر | 14 نانومتر12 نانومتر | 7 نانومتر | 7 نانومتر پلاس | 5/6 نانومتر؟ |
سرور | EPYC Naples | EPYC Naples | EPYC Rome | EPYC Milan | EPYC Genoa |
بیشترین تعداد هسته/رشته در سرور | 32/64 | 32/64 | 64/128 | نامشخص | نامشخص |
سطح بالای دسکتاپ | Ryzen Threadripper 1000 | Ryzen Threadripper 2000 | Ryzen Threadripper 3000Castle Peak | Ryzen Threadripper 4000 | Ryzen Threadripper 5000 |
بیشترین تعداد هسته/ رشته در سطح بالای دسکتاپ | 16/32 | 32/64 | 64/128؟ | نامشخص | نامشخص |
مصرف کننده | Ryzen 1000Summit Ridge | Ryzen 2000Pinnacle Ridge | Ryzen 3000Matisse | Ryzen 4000Vermeer | Ryzen 5000 |
بیشترین تعداد هسته/رشته در مصرف کننده | 8/16 | 8/16 | 16/32 | نامشخص | نامشخص |
APU مقرون به صرف | ندارد | Ryzen 2000Raven Ridge | Ryzen 3000Picasso Zen+ | Ryzen 4000 Renior | Ryzen 5000 |
سال | 2017 | 2018 | 2019 | 2020 | 2021؟ |
شتاب دهنده نسل بعدی Radeon Instinct
در سمت Radeon Instinct ما مشخصا با گرافیک بسیار قدرتمند طرف هستیم که احتمالا بر پایه فناوری کوچکتر از 7 نانومتری خواهد بود. AMD در حال حاضر مشغول آماده سازی شتاب دهنده Radeon Instinct Mi100 با اسم رمز Arcturus میباشد و گزارش شده 8192 پردازنده جریانی به همراه 32 گیگابایت حافظه HBM2e برای آن در نظر گرفته شده است.
این گرافیک مشخصا به خودی خود یک جانور وحشی محسوب میشود اما برای سال 2020 برنامه ریزی شده و بدون شک El Capitan از چیزی جدیدتر از Radeon Instinct Mi100 استفاده خواهد کرد. کارت گرافیک یا شتاب دهنده دقیق ذکر نشده اما ادعا شده این گرافیک جدید از یک معماری محاسباتی جدید استفاده میکند که:
- برای HPC و هوش مصنوعی بهینه شده
- عملیاتهای ترکیب شده (صحیح و اعشار) گسترش یافته برای کارایی بهینه در یادگیری عمیق
- حافظه نسل بعد با پهنای باند بالا
- حداکثر کارایی در پیکربندی چند گرافیک
براساس نکات اعلام شده، ما مشخصا شاهد چیزی فراتر از HBM2e و PCI Express 4.0 هستیم که در سال 2021 آماده استفاده کامل هستند در حالی که El Capitan در سال 2023 عملیاتی میشود. گفته شده گرافیک به شکل ویژه برای محاسبات / هوش مصنوعی / HPC طراحی شده که یعنی یک طراحی سفارشی برای بخشهای اعلام شده است و نه چیپی که شما در فضای مصرف کننده ببینید، درست به مانند شتاب دهندههای HPC انویدیا.
اینترکانکت Infinity Fabric نسل سوم
همچنین سومین قابلیت اصلی ابر کامپیوتر El Capitan اینجاست که هر پردازنده و شتاب دهنده AMD به اینترکانکت AMD Infinity Fabric نسل سوم مجهز خواهند شد. این اینترکانکت جدید ارتباط با پهنای باند بالا و تاخیر پایین را بین گرافیک و پردازنده فراهم میکند، حافظه یکپارچه را بین پردازنده و گرافیک ارائه میدهد در حالی که ماهیت انسجام کلی پلتفرم به بهبود کلی کارایی و سادگی برنامه نویسی کمک خواهد کرد.
در اسلاید پست شده توسط AMD، به نظر میرسد هر نود از چهار شتاب دهنده Radeon برخوردار باشد که به یک پردازنده EPYC Genoa از طریق Infinity Fabric 3.0 متصل هستند. این در کنار Slingshot Fabric خود Cray قرار میگیرد که در حال حاضر پهنای باندی تا 200 گیگابیت بر ثانیه را ارائه میدهد اما نسخههای آینده میتوانند پهنای باند بیشتری را برای زیر ساخت El Capitan فراهم کنند. تفاوت اینجاست که Slingshot بیشتر یک کانال نود به نود است در حالی که Infinity Fabric به یک اینترکانکت پردازنده به گرافیک نزدیکتر میباشد.
همچنین اشاره شده که انسجام حافظه کش بین پردازنده و گرافیک فارغ از تنها حافظه برقرار خواهد بود که یک موضوع بسیار مهم برای پلتفرمهای آینده HPC میباشد. یک اسلاید نیز مزیتهای پلتفرم ناهمگون را نشان میدهد که ایده خوبی از پلتفرمهای محاسباتی و شتاب دهنده آینده به ما میدهد. با تمام این حرفها AMD فردا روز تحلیل مالی خود را خواهد داشت، بنابراین بدون شک ما جزئیاتی را از Zen 4 و شتاب دهندههای اعلام شده Radeon Instinct خواهیم شنید.
دیدگاهتان را بنویسید