بالاخره انویدیا در جریان رویداد GTC2022 از پردازندههای گرافیکی Hopper H100 AI و HPC پبه همراه سوپرتراشههای Grace رونمایی کرد. مثل همیشه، مدلهای پردازشگر گرافیکی محاسباتی بسیار مقیاسپذیر هستند و انویدیا راهحلهای multi-GPU مختلفی را برای پاسخگویی به نیازهای مرکز داده مختلف ارائه میدهد. از طرف دیگر، یک واحد پردازشگر گرافیکی H100 Tensor Core معرفی شده است که نسبت به مدلهای A100 Ampere 2020، بهویژه در بخش عملیات FP، پیشرفتهای قابلتوجهی دارد.
افزایش چشم گیر قدرت پردازش H100 Hopper نسبت به Ampere
H100 Hopper بع عنوان اولین پردازنده گرافیکی انویدیا با مشخصات PCIe 5.0 و توان پشتیبانی از HBM3 VRAM رونمایی شده است. این پردازنده گرافیکی تا 6 برابر در نظر حجم کاری FP قویتر بوده و به میزان قابل توجهی مقیاس پذیری بالاتری نسبت به مدلهای نسل قبلی Ampere ارائه میدهد. انویدیا همچنین قصد دارد یک سوپرتراشه پردازنده گرافیکی Hopper + Grace CPU و حتی یک سوپرتراشه دوگانه Grace را عرضه کند.
استفاده از فرآیند 4 نانومتری TSMC در H100
پردازنده گرافیکی H100 بر اساس فرآیند 4 نانومتری TSMC ساخته شدهاند و اندازه قالب آن 814 میلی متر مربع است (14 میلی متر مربع کوچکتر از A100). این اولین مدل انویدیا است که دارای سازگاری PCIe 5.0 است و همچنین دارای یک فرم فاکتور SXM سریعتر است. پردازنده گرافیکی خود حدود 80 میلیارد ترانزیستور را شامل میشود که نشان دهنده افزایش تقریباً 50 درصدی تعداد ترانزیستورها نسبت به Ampere است. همچنین این پردازنده گرافیکی دارای 132 کلاستر با 16896 هسته CUDA برای استاندارد SXM و 14592 هسته CUDA برای استاندارد PCIe 5.0 است که تعداد آن نسبت به نسل قبلی دو برابر شده است.
حافظه نهان L2 نیز در آن از 40 مگابایت به 50 مگابایت افزایش یافته است، با این حال گذرگاه حافظه در 5120 بیت ثابت باقی میماند و ظرفیت حافظه بر اساس فرم فاکتور روی 80 گیگابایت HBM3 با پهنای باند 3 یا 2 ترابایت بر ثانیه تنظیم شده است. نسخه SXM دارای 528 هسته Tensor است که به 700 وات انرژی نیاز دارد، در حالی که نسخه PCIe تنها دارای 456 هسته Tensor است و از نظر TGP تنها به 350 وات محدود میشود.
تا آنجایی که به عملکرد FP مربوط میشود، پردازنده گرافیکی H100 میتواند 4 PFLOPS از FP8 (6 برابر A100)، 2 PFLOPS از FP16 (3 برابر بیشتر از A100)، 1 PFLOPS از TF32 (3 برابر A100) و 60 TFLOPS از FP64/FP32 یعنی (3 برابر A100) پردازش انجام دهد. بهبودهای مشابهی را میتوان با محاسبات Tensor Core FP به دست آورد.
سوپرتراشه Grace Hopper ترکیبی از CPU و GPU قدرتمند انویدیا
انویدیا همچنین در حال برنامهریزی برای عرضه یک ماژول سوپرتراشه Grace Hopper است که ترکیبی از GPU H100 و CPU Grace است. همانند آن، یک سوپرتراشه Grace نیز وجود خواهد داشت که دو CPU Grace را با 144 هسته ARM، پهنای باند حافظه 1 TB/s LPDDR5x و 396 مگابایت کش روی یک تراشه ارائه میکند. این سوپرتراشه Grace را میتوان با حداکثر هشت پردازنده گرافیکی Hopper جفت کرد، اما چنین تنظیماتی زودتر از سه ماهه سوم 2023 در دسترس نخواهند بود. با این حال، پردازندههای گرافیکی Hopper انویدیا در سه ماهه سوم 2022 عرضه خواهند شد.
مطالب مرتبط:
دیدگاهتان را بنویسید