کمپانی انویدیا شتاب دهنده Nvidia A100 PCIe بر پایه معماری Ampere با استاندارد PCI Express 4.0 را معرفی نمود. این محصول از مشخصات یکسانی با نمونه A100 SXM بهره میبرد اما چند تغییر را نیز شاهد هستیم.
A100 PCIe از توان حرارتی 250 وات برخوردار است. با توجه ComputerBase که از انویدیا نقل قول کرده، این کارت از توان حرارتی پایینترین بهره میبرد و در واقع مقایسه آن با نمونه SXM با توان حرارتی 400 وات به خوبی چنین موضوعی را نشان میدهد. با این حال علی رغم توان حرارتی پایینتر مدل PCIe انویدیا ادعا میکند که نهایت قدرت هر دو مدل یکسان خواهد بود و فقط در طی بارهای کاری طولانی مدت شاهد 10 الی 50 درصد کارایی پایینتر نسبت به نمونه SXM4 هستیم.
مدل PCIe با 40 گیگابایت حافظه HBM2e به مانند نسخه SXM همراه است. همچنین 6912 هسته CUDA و 432 هسته Tensor را شاهد هستیم اما خبری از هستههای RT نیست که البته در این زمینه مورد نیاز نیست. A100 PCIe شتاب دهندهای طراحی شده برای آموزش هوش مصنوعی و استنتاج است. البته که به عنوان یک کارت محاسباتی در دیتاسنترهای بزرگ نیز فعالیت خواهد کرد. سیستمهایی بای شتاب دهندههای A100 PCIe و A100 SXM از تولید کنندگان سرور مختلف در دسترس قرار گرفتهاند.
شتاب دهنده Nvidia A100 PCIe
A100 PCIe | A100 SXM | Tesla V100s | Tesla V100 | Tesla P100 | |
پردازنده گرافیکی | 7 نانومتری GA100 | 7 نانومتری GA100 | 12 نانومتری GV100 | 12 نانومتری GV100 | 16 نانومتری GP100 |
ابعاد die | 826 میلیمتر مربع | 826 میلیمتر مربع | 815 میلیمتر مربع | 815 میلیمتر مربع | 610 میلیمتر مربع |
تعداد ترانزیستور | 54 میلیارد | 54 میلیارد | 21.1 میلیارد | 21.1 میلیارد | 15.3 میلیارد |
تعداد SM | 108 | 108 | 80 | 80 | 56 |
تعداد هسته CUDA | 6912 | 6912 | 5120 | 5120 | 3840 |
تعداد هسته Tensor | 432 | 432 | 640 | 640 | ندارد |
عملکرد FP16 | 39 ترافلاپ | 39 ترافلاپ | 32.8 ترافلاپ | 31.4 ترافلاپ | 21.2 ترافلاپ |
عملکرد FP32 | 19.5 ترافلاپ | 19.5 ترافلاپ | 16.4 ترافلاپ | 15.7 ترافلاپ | 10.6 ترافلاپ |
عملکرد FP64 | 9.7 ترافلاپ | 9.7 ترافلاپ | 8.8 ترافلاپ | 7.8 ترافلاپ | 5.3 ترافلاپ |
فرکانس بوست | 1410 مگاهرتز | 1410 مگاهرتز | 1601 مگاهرتز | 1533 مگاهرتز | 1480 مگاهرتز |
حداکثر پهنای باند حافظه | 1536 گیگابایت بر ثانیه | 1134 گیگابایت بر ثانیه | 1134 گیگابایت بر ثانیه | 900 گیگابایت بر ثانیه | 721 گیگابایت بر ثانیه |
فرکانس موثر حافظه | نامشخص | 2430 مگاهرتز | 2214 مگاهرتز | 1760 مگاهرتز | 1408 مگاهرتز |
پیکربندی حافظه | 40 گیگابایت HBM2e | 40 گیگابایت HBM2e | 32 گیگابایت HBM2e | 16 / 32 گیگابایت HBM2e | 16 گیگابایت HBM2e |
گذرگاه حافظه | 5120 بیت | 5120 بیت | 4096 بیت | 4096 بیت | 4096 بیت |
توان حرارتی | 250 وات | 400 وات | 250 وات | 300 وات | 300 وات |
فرم فاکتور | PCI Express 4.0 | SXM4 | PCI Express 3.0 | SXM2 / PCI Express 3.0 | SXM |
بیشتر بخوانید: گرافیک RTX 3080 Ti در Time Spy – اولین نگاه به قدرت Ampere
یدونه ازیا بخری با xe یا 3990x ببندی
بشینی فقط فیلم 10bit 4k تماشا کنی 😂😂😂
این کارت که خروجی تصویر نداره.