جزئیات بیشتر از ابرکامپیوتر Aurora منتشر شد تا نشان دهد این غول پردازشی به گرافیک نسل بعدی Xe HPC Ponte Vecchio و پردازنده Sapphire Rapids Xeon مجهز خواهد میشود. این ابرکامپیوتر امسال در آزمایشگاه ملی آرگون آغاز به کار خواهد کرد و یکی از اولین ماشینهای Exascale سیاره میباشد.
حضور لاین آپ HPC اینتل برای سال 2021 در ابر کامپیوتر Aurora باعث میشود تا از نظر فنی یک مدل بی نظیر و سریع لقب گیرد. در نشست سالانه ECP جزئیات بیشتر از ابرکامپیوتر Aurora رونمایی شد که به پیکربندی و مشخصات سخت افزاری این ماشین اشاره دارد.
ابر کامپیوتر Aurora برای آغاز فعالیت در سال 2021 برنامه ریزی شده و در حالت حداکثر بیش از 1 اگزافلاپ عملکرد را فراهم میکند. این ماشین از گرافیکهای Intel Xe HPC 7nm Ponte Vecchio و پردازندههای Sapphire Rapids 10nm++ Xeon استفاده میکند. هر نود شامل 6 گرافیک Xe HPC و 2 پردازنده Sapphire Rapids میشود. 6 گرافیک Ponte Vecchio یا PVC از ارتباط کامل با یکدیگر به همراه تاخیر و پهنای باند بالا بهره میبرند. همچنین طراحی یکپارچه حافظه برای پردازندهها و گرافیکها در نظر گرفته شده.
در بحث حافظه، تجهیزات ذخیره سازی و پهنای باند ما شاهد حافظه سیستمی بیش از 10 پتابایت و اینترکانکت Cray Slingshot Fabric (پلتفرم Shasta) هستیم. در نهایت 8 Slingshot Fabric برای هر نود ابر کامپیوتر Aurora در نظر گرفته شده. این سیستم از دو فایل سیستم متفاوت بهره میبرد که یکی از آنها DAOS یا Distributed Asynchronous Object Store و دیگری نیز Lustre میباشد.
DAOS:
- در حدود 230 پتابایت ظرفیت ذخیره سازی
- پهنای باند بالاتر از 25 ترابایت بر ثانیه
Lustre:
- 150 پتابایت ظرفیت ذخیره سازی کامل
- پهنای باند در حدود 1 ترابایت بر ثانیه
یک رَک Aurora توسط Cray به عنوان جزئی از سیستم Shasta طراحی خواهد شد که از پردازندههای مختلف پشتیبانی کرده و از محفظههای بهینه شده برای تراکم، خنک کنندگی بهینه و پهنای باند شبکه بالا برخوردار است. Cray همچنین نرم افزار خود برای بهبود ماژولار بون را فراهم خواهد کرد در حالی که اینترکانکت یکپارچه و بالا رده خود را نیز ارائه میدهد. اینترکانکت Slingshot نسل هشتم در این سیستم استفاده میشود. همچنین سوییچهای با پهنای باند بالا Rosetta نیز در نظر گرفته شده است. اجازه دهید در کنار جزئیات بیشتر از ابرکامپیوتر Aurora کمی هم به مشخصات پردازندهها و گرافیکهای نسل بعدی این ماشین بپردازیم.
اطلاعات بیشتر درباره گرافیک 7 نانومتری Intel Ponte Vecchio
معمار ارشد اینتل یعنی راجا کادوری قبلا اشاره کرده بود که گرافیک Xe “پدر تمام گرافیکها” خواهد بود. با توجه به این که Ponte Vecchio یک گرافیک کلاس سازمانیست برای فعالیت در ابر کامپیوترهای فوق العاده قدرتمند و جانشین گرافیکهای سری Xe HP خواهد بود، واضح است که بسیار قدرتمندتر از “پدر تمام گرافیکها” میباشد.
تاشش گرافیک Ponte Vecchio در ابر کامپیوتر آینده Aurora در کنار دو پردازنده Sapphire Rapids Xeon فعالیت خواهند کرد. این گرافیکها از طریق CXL یا Compute Express Link با بسته نرم افزاری OneAPI به یکدیگر متصل خواهند شد. حتی در افشاگری قبلی ادعا شده بود که گرافیکهای PV از تکنولوژی پکیجینگ Foveros به همراه CXL استفاده خواهند کرد.
گرافیک Intel Ponte Vecchio از خروجی محاسباتی بالایی نیز برخوردار است. همچنین زمینههای فعالیت گرافیکهای Xe نیز مشخص شده بود که شامل HPC/Exascale، یادگیری عمیق، Cloud GFX، تجزیه و تحلیل رسانه، ایستگاه کاری، گیمینگ، نوت بوکها و الترابوکها میباشد.
کمی جست و جو در گوگل با اسم رمزهای مرتبط پروژه مانند Ponte Vecchio و Arctic Sound لیستهای شغلی را در LinkedIn نشان میدهد.
این امر نه تنها نشان میدهد که اینتل مدت زمانیست که روی Ponte Vecchio کار میکند بلکه مشخص میشود که Ponte Vecchio مشتقی از خانواده Arctic Sound میباشد که به شکل مستقیم دیتاسنتر را هدف گرفته بود. ما تصور میکنیم که این گرافیکها گیمرها را هدف قرار نخواهند داد.
قبلا به نظر میرسید که وجود 4096 هسته غلط باشد زیرا عرضه یک گرافیک با چنین تعداد هستهای و توان حرارتی 500 وات به واقع معادل یک خودکشی از سوی اینتل بود. از آنجایی که Intel Xe HP از 512 واحد اجرایی به ازای هر چیپ بهره میبرد، مقدار واقعی واحد اجرایی (نه هسته) در پیکربندی 1 چیپ، 2 چیپ و 4 چیپ به ترتیب 512 واحد اجرایی، 1024 واحد اجرایی و 2048 واحد اجرایی میباشد.یک گرافیک عظیم با 2048 واحد اجرایی و توان حرارتی 500 وات روی کاغذ منطقیتر به نظر میرسد.
حالا با توجه به این که ما شاهد معماری متفاوتی در این دو (Xe HP و Xe LP) هستیم، میزان هستهها در واحد اجرایی نیز میتواند متفاوت باشد، اما اگر این میزان را یکسان فرض کنیم (البته که با یک اگر بزرگ طرف هستیم) شما شاهد 16384 هسته خواهید بود. فرکانس 1200 مگاهرتز را نیز در نظر میگیریم تا این هیولا قادر باشد 39.3 ترافلاپ قدرت پردازشی را تنها در 500 وات ارائه دهد.
- گرافیک Intel Xe HP با یک Tile: تعداد 512 واحد اجرایی، 4096 هسته، فرکانس 1.5 گیگاهرتز (فرض شده)، توان محاسباتی 12.2 ترافلاپ، توان حرارتی 150 وات
- گرافیک Intel Xe HP با دو Tile: تعداد 1024 واحد اجرایی، 8192 هسته، فرکانس 1.25 گیگاهرتز (فرض شده)، توان محاسباتی 20.48 ترافلاپ، توان حرارتی 300 وات
- گرافیک Intel Xe HP با چهار Tile: تعداد 2048 واحد اجرایی، 16384 هسته، فرکانس 1.1 گیگاهرتز (فرض شده)، توان محاسباتی 36 ترافلاپ، توان حرارتی 400 / 500 وات
پلتفرم Intel ATS قرار است اولین حرکت واقعی شرکت برای ورود به دنیای محاسبات سطح بالا باشد و اساسا نمونه اولیه برای Ponte Vecchio خواهد بود. نکته جالب اینجاست که ظاهرا فعلا تنها نمونههای یک چیپ و دو چیپ تایید شدهاند و فعلا خبری از مدل چهار چیپ نخواهد بود.
پردازندههای Intel Sapphire Rapids Xeon
Sapphire Rapids که بر پایه فناوری 10nm++ ساخته خواهد شد انتظار میرود از معماری هسته Willow Cove استفاده کند که جایگزین Sunny Cove خواهد بود. لاینآپ سافایر راپیدز از حافظههای هشت کاناله DDR5 و PCI Express 5.0 تحت پلتفرم Eagle Stream استفاده خواهد کرد. این به اینتل اجازه میدهد تا با AMD رقابت یا حتی از آن جلو بزند اگر پلتفرم EPYC Milan این شرکت همچنان از DDR4 و PCIe 4.0 استفاده کند. فعلا باید منتظر بمانیم.
خانواده Sapphire Rapids در همان سالی عرضه میشود که اینتل از پردازندههای گرافیکی مخصوص دیتاسنتر Xe خود برپایه نود 7 نانومتر رونمایی خواهد کرد. اولین محصولی که از این گرافیکها در آن استفاده خواهد شد، ابر کامپیوتر Aurora است. پردازندههای گرافیکی Xe براساس فناوری جدید Foveros 3D ساخته خواهند شد که بدین معناست شاهد یک چیپ پشته سازی شده که هارمونی بین پردازنده گرافیکی، حافظه و اینترکانکت ایجاد کرده هستیم.
چنین فناوری ساختی اجازه میدهد حافظههایی با پهنای باند بالا (مانند HBM) درست روی die پردازنده سوار شوند، پکیج نهایی بسیار کوچکتر گرافیکهای حال حاضر است اما در عین حال چگالی بالاتری را ارائه میدهد.
سرانجام برای سال 2022 شاهد عرضه Granite Rapids-SP هستیم که براساس همان Sapphire Rapids ساخته میشود اما ممکن است شاهد ریخته گری 7 نانومتری باشیم. نقشه راه فناوری اینتل نشان میدهد که آنها 7nm+ را همراه با معماری هسته Golden Cove در سال 2022 عرضه خواهند کرد. هنوز نمیدانیم چه تعداد هسته در خانواده زئون سری راپیدز اینتل وجود خواهد داشت اما چیزی که مشخص است، افزایش سرعت اینتل در لاینآپ زئون است زیرا رقیب (AMD) در این مورد عملکرد بهتری داشته است.
خانودههای Intel Xeon SP
نام خانواده | Skylake-SP | Cascade Lake-SP/AP | Cooper Lake-SP/AP | Ice Lake-SP | Sapphire Rapids | Granite Rapids |
فناوری | 14nm+ | 14nm++ | 14nm++ | 10nm+ | 10nm++ | 7nm+? |
نام پلتفرم | Intel Purley | Intel Purley | Intel Whitley | Intel Whitley | Intel Eagle Stream | Intel Eagle Stream |
پکیج شامل چند چیپ (MCP) | خیر | بله | بله | بله | نامشخص | نامشخص |
سوکت | LGA3647 | LGA3647 BGA5903 | LGA4189 BGA5903 | LGA4189 | نامشخص | نامشخص |
بیشترین تعداد هسته | تا 28 هسته | تا 28 هسته تا 48 هسته | تا 28 هسته تا 48 هسته | نامشخص | نامشخص | نامشخص |
بیشترین تعداد رشته (تِرِد) | تا 56 رشته | تا 56 رشته تا 96 رشته | تا 56 رشته تا 96 رشته | نامشخص | نامشخص | نامخصش |
بیشترین مقدار کش سطح 3 | 38.5 مگبایت | 38.5 مگابایت 66 مگابایت | نامشخص | نامشخص | نامشخص | نامشخص |
پشتیبانی از حافظه | DDR4-2666 6-Channel | DDR4-2933 6-Channel DDR4-2933 12-Channel | 8-Channel DDR4 | 8-Channel DDR4 | 8-Channel DDR5 | 8-Channel DDR5 |
پشتیبانی از نسل PCIe | PCIe 3.0 | PCIe 3.0 | PCIe 3.0 | PCIe 4.0 | PCIe 5.0 | PCIe 5.0 |
محدود توان مصرفی | 140W-205W | 165W-205W | نامشخص | تا 230W | نامشخص | نامشخص |
3D Xpoint Optane DIMM | ندارد | Apache Pass | Barlow Pass | Barlow Pass | Crow Pass | Donahue Pass |
رقیب | AMD EPYC Naples 14nm | AMD EPYC Rome 7nm | AMD EPYC Rome 7nm | AMD EPYC Milan 7nm+ | نسل بعد AMD EPYC | نسل بعد AMD EPYC |
زمان عرضه | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 |
البته یکی از نکات جالب فارغ از جزئیات بیشتر از ابرکامپیوتر Aurora را باید در ابر کامپیوترهای دیگر مانند Frontier جست و جو کنیم که این مدل نیز در سال 2021 عملیاتی خواهد شد. با توجه به قدرت 1.5 اگزافلاپی Frontier در مقابل 1 اگزافلاپ Aurora شاید باید محصولات نسل بعدی تیم سرخ را بهتر از رقیب آبی ببینیم اما هنوز برای نتیجه گیری کمی زود است.
سلام بر نویسندهء محترم.
خبر جالبی بود.
متشکریم.