یک ماه پس از کنفرانس GTC 2022، وب سایت ServeTheHome سرانجام تصویر گرافیک H100 SXM انویدیا را به عنوان جدید مدل دیتاسنتر تیم سبز منتشر نموده. H100 شتاب دهنده 4 نانومتری با معماری Hopper است. تا به حال تنها شاهد رندرهای این محصول بودیم اما خوش بختانه طراحی جدید فرم فاکتور SXM را در دنیای واقعی در اختیار داریم.
- قدرت محاسباتی 100 ترافلاپی GeForce RTX 4090 – تا 2.5 برابر بیشتر از RTX 3090 Ti
- فروش گرافیک H100 انویدیا در ژاپن با قیمت بیش از 30,000 دلار
- گرافیک 900 واتی انویدیا با چیپ AD102 – جزئیاتی از سری RTX 40
مدل بُرد این دستگاه PG520 نام دارد. H100 از فناوری TSMC CoWoS بهره میبرد و شامل چیپ عظیم GH100 بالغ بر 814 میلی متر مربع و شش ماژول حافظه در اطراف آن است. طرح بندی کانکتورهای SXM نیز نسبت به مدل A100 تغییر کرده، حالا بجای دو کانکتور بزرگ در هر سمت چیپ، یکی از آنها کوتاهتر است.
تصویر گرافیک H100 SXM انویدیا
مدل Hopper تا 700 وات انرژی مصرف میکند که 250 الی 300 وات بیشتر از گرافیکهای SXM بر پایه معماریهای Ampere و Volta خواهد بود.
به تازگی شاهد پیش فروش مدل H100 در ژاپن با قیمت 33,000 دلار بودیم. البته مدل مذکور بر پایه PCIe Gen 5.0 بود در حالی که نسخه SXM از تعداد هسته CUDA، حافظه و توان حرارتی بیشتری بهره میبرد.
NVIDIA H100 SXM5 | NVIDIA H100 PCIe | A100 PCIe | A100 SXM | Tesla V100s | Tesla V100 | Tesla P100 | |
پردازنده گرافیکی | 4 نانومتری GH100 | 4 نانومتری GH100 | 7 نانومتری GA100 | 7 نانومتری GA100 | 12 نانومتری GV100 | 12 نانومتری GV100 | 16 نانومتری GP100 |
ابعاد die | 814 میلیمتر مربع | 814 میلیمتر مربع | 826 میلیمتر مربع | 826 میلیمتر مربع | 815 میلیمتر مربع | 815 میلیمتر مربع | 610 میلیمتر مربع |
تعداد ترانزیستور | 80 میلیارد | 80 میلیارد | 54 میلیارد | 54 میلیارد | 21.1 میلیارد | 21.1 میلیارد | 15.3 میلیارد |
تعداد SM | 132 | 114 | 108 | 108 | 80 | 80 | 56 |
تعداد هسته CUDA | 16896 | 14592 | 6912 | 6912 | 5120 | 5120 | 3840 |
تعداد هسته Tensor | 528 | 456 | 432 | 432 | 640 | 640 | ندارد |
عملکرد FP16 | 2000 ترافلاپ | 1600 ترافلاپ | 312 ترافلاپ | 312 ترافلاپ | 32.8 ترافلاپ | 31.4 ترافلاپ | 21.2 ترافلاپ |
عملکرد FP32 | 1000 ترافلاپ | 800 ترافلاپ | 156 ترافلاپ | 156 ترافلاپ | 16.4 ترافلاپ | 15.7 ترافلاپ | 10.6 ترافلاپ |
عملکرد FP64 | 60 ترافلاپ | 48 ترافلاپ | 19.5 ترافلاپ | 19.5 ترافلاپ | 8.8 ترافلاپ | 7.8 ترافلاپ | 5.3 ترافلاپ |
فرکانس بوست | نامشخص | نامشخص | 1410 مگاهرتز | 1410 مگاهرتز | 1601 مگاهرتز | 1533 مگاهرتز | 1480 مگاهرتز |
پیکربندی حافظه | 80 گیگابایت HBM3 | 80 گیگابایت HBM2e | 40 گیگابایت HBM2e | 40 گیگابایت HBM2e | 32 گیگابایت HBM2e | 16 / 32 گیگابایت HBM2e | 16 گیگابایت HBM2e |
گذرگاه حافظه | 5120 بیت | 5120 بیت | 5120 بیت | 5120 بیت | 4096 بیت | 4096 بیت | 4096 بیت |
توان حرارتی | 700 وات | 350 وات | 250 وات | 400 وات | 250 وات | 300 وات | 300 وات |
فرم فاکتور | SXM5 | PCI Express 5.0 | PCI Express 4.0 | SXM4 | PCI Express 3.0 | SXM2 / PCI Express 3.0 | SXM |
دیدگاهتان را بنویسید