در کنار رونمایی از پردازنده و گرافیکهای دیگر، انویدیا همچنین کارتهای A10 و A30 را نیز به عنوان دو گرافیک جدید Ampere Tensor Core معرفی نمود. این دو مدل مشخصا بازار دیتاسنتر را هدف گرفتهاند و بیشتر برای پلتفرمهای مجازی سازی کاربرد خواهند داشت.
نکته جالب توجه درباره این گرافیکهای Tensor Core مشخصات آنها میباشد. A10 از چیپ GA102 استفاده میکند در حالی که A30 به چیپ GA100 مجهز شده است. در حالی که هر دو بر پایه معماری Ampere هستند اما زیر سیستم حافظه برای این گرافیکها کاملا متفاوت میباشد جایی که A10 از GDDR6 بهره میبرد ولی A30 با استاندارد HBM2 عرضه میشود.
مشخصات دو گرافیک جدید Ampere Tensor Core
گرافیک NVIDIA A10 Ampere Tensor Core
A10 Tensor Core همانطور که گفته شد از چیپ GA102-890 بهره میبرد. این نمونه 72 واحد چند پردازنده جریانی با 9216 هسته CUDA را در خود جای داده. پردازنده گرافیکی در فرکانس پایه 885 مگاهرتز و بوست 1695 مگاهرتز فعالیت میکند. رابط PCI Express Gen 4.0 و همچنین 24 گیگابایت حافظه GDDR6 با سرعت 12.5 گیگابیت بر ثانیه و گذرگاه 384 بیت برای آن در نظر گرفته شده تا شاهد پهنای باند 600 گیگابایت بر ثانیه باشیم.
در زمینه طراحی ما شاهد رنگی طلایی هستیم که محفظه تک اسلات اما با طول کامل کارت را پوشش داده است. از آنجایی که کارت به شکل غیر فعال خنک میشود، هیچ فنی در کار نیست و یک کانکتور برق 8 پین توان 150 واتی را تامین خواهد کرد. از نظر کارایی A10 Tensor Core میتواند تا 31.2 ترافلاپ FP32، تا 62.5 ترافلاپ TF32، تا 125 ترافلاپ BFLOAT16، تا 250TOPS INT8، تا 500TOPS INT4 و دو برابر این مقادیر را با Sparsity ارائه دهد.
گرافیک NVIDIA A30 Ampere Tensor Core
گرافیک A30 Tensor Core از طرف دیگر با چیپ GA100 همراه شده اما نمونه دقیق چیپ مشخص نیست. به نظر میرسد ما شاهد مدلی تقلیل یافته هستیم که از فرکانس پایه 930 مگاهرتز و بوست 1440 مگاهرتز استفاده میکند. برای این گرافیک 24 گیگابایت حافظه HBM2 در نظر گرفته شده که در فرکانس 1215 مگاهرتز و گذرگاه 3072 بیتی فعالیت خواهد کرد. این یعنی ما تنها سه پشته HBM2 فعال در این مدل را شاهد هستیم و پهنای باند نیز به 933 گیگابایت بر ثانیه میرسد.
برخلاف A10 مدل A30 Tensor Core از طراحی دو اسلات و کامل بهره میبرد. هر چند که باز هم یک کانکتور برق 8 پین در نظر گرفته شده اما توان مورد نیاز 165 وات میباشد. از نظر کارایی A30 Tensor Core میتواند تا 5.2 ترافلاپ FP64، تا 10.3 ترافلاپ FP64TF، تا 10.3 ترافلاپ FP32، تا 82 ترافلاپ TF32، تا 165 ترافلاپ BFLOAT16، تا 330TOPS INT8، تا 661TOPS INT4 و دو برابر این مقادیر را با Sparsity ارائه دهد.
مدل | A10 Tensor Core | A30 Tensor Core |
پردازنده گرافیکی | GA102-890 | GA100 |
عملکرد FP64 | – | 5.2 ترافلاپ |
عملکرد FP64 Tensor Core | – | 10.3 ترافلاپ |
عملکرد FP32 | 31.2 ترافلاپ | 10.3 ترافلاپ |
عملکرد TF32 Tensor Core | 62.5 ترافلاپ / 125 ترافلاپ | 82 ترافلاپ / 165 ترافلاپ |
عملکرد BFLOAT16 Tensor Core | 125 ترافلاپ / 250 ترافلاپ | 165 ترافلاپ / 330 ترافلاپ |
عملکرد FP16 Tensor Core | 125 ترافلاپ / 250 ترافلاپ | 165 ترافلاپ / 330 ترافلاپ |
عملکرد INT8 Tensor Core | 250TOPS / 500TOPS | 330TOPS / 661TOPS |
عملکرد INT4 Tensor Core | 500TOPS / 1000TOPS | 661TOPS / 1321TOPS |
تعداد هسته RT | 72 | – |
حافظه | 24 گیگابایت GDDR6 | 24 گیگابایت HBM2 |
پهنای باند حافظه | 600 گیگابایت بر ثانیه | 933 گیگابایت بر ثانیه |
رابط | PCI Express Gen 4.0 | PCI Express Gen 4.0 نسل سوم NVLINK |
فرم فاکتور | تک اسلات طول کامل FHFL | دو اسلات طول کامل FHFL |
توان حرارتی | 150 وات | 165 وات |
پشتیبانی از نرم افزارهای vGPU | NVIDIA Virtual PC NVIDIA Virtual Applications NVIDIA RTX Virtual Workstation NVIDIA Virtual Compute Server | NVIDIA AI Enterprise for VMware NVIDIA Virtual Compute Server |
بیشتر بخوانید: سیستم روی چیپ Nvidia Atlan رونمایی شد – پردازنده نسل جدید Grace
دیدگاهتان را بنویسید