انویدیا Blackwell Ultra GB300؛ سریع‌ترین تراشه هوش مصنوعی با بیش از 20000 هسته و حافظه 288 گیگابایت HBM3e

توسط نیما خردمند ·3 شهریور 14043 شهریور 1404· 0

انویدیا جزئیات کامل سریع‌ترین تراشه هوش مصنوعی خود را با نام Blackwell Ultra GB300 منتشر کرد؛ تراشه‌ای که 50 درصد سریع‌تر از GB200 عمل می‌کند و به حافظه 288 گیگابایت مجهز شده است.

هم‌زمان با کاهش قیمت کارت‌های گرافیک سری RTX 50 در بریتانیا و اروپا، انویدیا در گیمزکام 2025 از مجموعه‌ای از نوآوری‌های گرافیکی، از جمله ارتقاء سرویس GeForce Now و قابلیت‌های تازه در Nvidia App گرفته تا معرفی فناوری واقع‌گرایانه موی RTX پرده برداشت. همچنین، باندل اختصاصی بازی Borderlands 4 برای دارندگان RTX 50 نشان می‌دهد که انویدیا علاوه‌بر هوش مصنوعی، تمرکز ویژه‌ای بر تجربه گیمینگ نسل جدید دارد.

تراشه Blackwell Ultra GB300؛ معجزه انویدیا برای هوش مصنوعی

چند روز پیش انویدیا مقاله‌ای منتشر کرد که در آن به بررسی دقیق جدیدترین و قدرتمندترین تراشه هوش مصنوعی خود یعنی Blackwell Ultra GB300 پرداخت. این تراشه وارد مرحله تولید انبوه شده و هم‌اکنون در اختیار مشتریان کلیدی قرار دارد. هرچند این تراشه نسخه توسعه‌یافته معماری Blackwell محسوب می‌شود، اما از نظر کارایی و قابلیت‌ها ارتقای چشمگیری به همراه دارد.

همان‌طور که سری Super انویدیا نسخه پیشرفته کارت‌های گرافیک RTX برای بازی به شمار می‌رود، سری Ultra نیز نسخه بهینه‌شده تراشه‌های هوش مصنوعی معرفی‌شده پیشین است. در معماری‌های Hopper و Volta نسخه Ultra وجود نداشت، اما مدل‌های بهبودیافته آن‌ها به نوعی چنین نقشی را ایفا می‌کردند. علاوه بر برتری سخت‌افزاری، بهینه‌سازی‌های نرم‌افزاری نیز به افزایش کارایی مدل‌های غیر Ultra کمک می‌کنند.

مشخصات کلی Nvidia Blackwell Ultra GB300

نسخه GB300 به عنوان یک گرافیک پیشرفته از دو قالب Reticle تشکیل شده که به وسیله رابط پهنای باند بالای NV-HBI به یکدیگر متصل شده و در نهایت به صورت یک تراشه واحد عمل می‌کنند. این گرافیک با فناوری TSMC 4NP «نسخه بهینه 5 نانومتری برای انویدیا» تولید شده و 208 میلیارد ترانزیستور در خود جای داده است. رابط NV-HBI پهنای باند 10 ترابایت بر ثانیه را میان دو قالب گرافیک فراهم می‌کند و عملکردی یکپارچه ارائه می‌دهد.

این کارت گرافیک شامل 160 واحد SM است که هرکدام 128 هسته CUDA، چهار هسته Tensor نسل پنجم با پشتیبانی از FP8، FP6 و NVFP4، حافظه Tensor یا TMEM با ظرفیت 256 کیلوبایت و واحدهای SFU دارند. در مجموع این مشخصات به 20480 هسته CUDA و 640 هسته Tensor به همراه 40 مگابایت حافظه TMEM می‌رسند.

مقایسه Hopper، Blackwell و Blackwell Ultra

ویژگی	Hopper	Blackwell	Blackwell Ultra
فناوری ساخت	TSMC 4N	TSMC 4NP	TSMC 4NP
تعداد ترانزیستور	80B	208B	208B
تعداد قالب GPU	1	2	2
عملکرد NVFP4	–	10	20 PetaFLOPS
عملکرد FP8	2	4 PetaFLOPS	5
تسریع Attention	4.5 TeraExponentials/s	5 TeraExponentials/s	10.7 TeraExponentials/s
حداکثر ظرفیت حافظه HBM	80 گیگابایت HBM «H100»؛ 141 گیگابایت HBM3E «H200»	192 گیگابایت HBM3E	288 گیگابایت HBM3E
حداکثر پهنای باند HBM	3.35 ترابایت بر ثانیه «H100»؛ 4.8 TB/s «H200»	8 ترابایت بر ثانیه	8 ترابایت بر ثانیه
پهنای باند NVLink	900 گیگابایت بر ثانیه	1800 گیگابایت بر ثانیه	1800 گیگابایت بر ثانیه
حداکثر توان مصرفی «TGP»	تا 700 وات	تا 1200 وات	تا 1400 وات

هسته‌های Tensor نسل پنجم؛ قلب پردازش هوش مصنوعی

تمام عملیات محاسباتی هوش مصنوعی توسط هسته‌های Tensor نسل پنجم انجام می‌شود. انویدیا در هر نسل نوآوری بزرگی در این بخش ارائه کرده است:

Volta؛ واحدهای MMA با 8 نخ پردازشی و FP16 همراه با FP32 برای آموزش
Ampere؛ اجرای MMA در سطح Warp کامل با فرمت‌های BF16 و TensorFloat-32
Hopper؛ واحد MMA در گروه Warp با 128 نخ و موتور Transformer با پشتیبانی از FP8
Blackwell؛ موتور Transformer نسل دوم با FP8، FP6 و NVFP4 به همراه حافظه TMEM

هسته‌های Tensor نسل پنجم؛ قلب پردازش هوش مصنوعی

ارتقای حافظه در Blackwell Ultra

این نسخه با حافظه 288 گیگابایت HBM3e در 8 پشته و رابط 8192 بیتی با پهنای باند 8 ترابایت بر ثانیه عرضه می‌شود. در حالی‌که مدل GB200 تنها 192 گیگابایت داشت، این ارتقا امکان پشتیبانی از مدل‌های هوش مصنوعی با تریلیون‌ها پارامتر را فراهم می‌کند. مزایا شامل:

اجرای مدل‌های 300B+ پارامتر بدون نیاز به جابجایی حافظه
افزایش طول زمینه در مدل‌های Transformer به کمک ظرفیت بیشتر KV Cache
بهبود نسبت محاسبه به حافظه در بارهای کاری متنوع

اتصالات و ارتباطات داده

ارتباط در این گرافیک توسط NVLink نسل پنجم، NVLink-C2C و رابط PCIe Gen6 x16 برقرار می‌شود. ویژگی‌ها شامل:

پهنای باند دوطرفه 1.8 ترابایت بر ثانیه به ازای هر گرافیک «18 لینک × 100 گیگابایت بر ثانیه»
بهبود دو برابری نسبت به NVLink 4 در Hopper
پشتیبانی از پیکربندی حداکثر 576 گرافیک در ساختار بدون انسداد
یکپارچگی در سطح رک با چینش NVL72 شامل 72 گرافیک و پهنای باند 130 ترابایت بر ثانیه
ارتباط CPU-GPU با NVLink-C2C و قابلیت همسان‌سازی حافظه با پهنای باند 900 گیگابایت بر ثانیه

جدول مقایسه اتصالات در معماری‌های Hopper، Blackwell و Blackwell Ultra

ویژگی	Hopper	Blackwell	Blackwell Ultra
NVLink «GPU-GPU»	900 GB/s	1800 GB/s	1800 GB/s
NVLink-C2C «CPU-GPU»	900 GB/s	900 GB/s	900 GB/s
رابط PCIe	128 GB/s «Gen 5»	256 GB/s «Gen 6»	256 GB/s «Gen 6»

دقت محاسباتی و بهره‌وری

این گرافیک با استاندارد NVFP4 توان افزایش 50 درصدی در محاسبات کم‌دقت متراکم به دست آورده و در عین حال به دقت نزدیک به FP8 می‌رسد. تفاوت با FP8 معمولاً کمتر از 1 درصد است. علاوه بر این، میزان حافظه مصرفی در مقایسه با FP8 حدود 1.8 برابر کمتر و در مقایسه با FP16 حدود 3.5 برابر کمتر است.

مدیریت پیشرفته و امنیت سازمانی

Blackwell Ultra GB300 امکانات امنیتی و مدیریتی جدیدی ارائه می‌دهد:

موتور GigaThread نسل جدید با زمان‌بندی بهینه و توزیع بهتر بار پردازشی میان 160 SM
پشتیبانی از Multi-Instance GPU «MIG» برای تقسیم گرافیک به چند نمونه مستقل؛ به‌طور مثال ایجاد دو نمونه با 140 گیگابایت حافظه یا چهار نمونه با 70 گیگابایت یا هفت نمونه با 34 گیگابایت
رایانش محرمانه و امنیت هوش مصنوعی با TEE سخت‌افزاری و NVLink رمزگذاری‌شده بدون افت پهنای باند محسوس
موتور RAS پیشرفته با بهره‌گیری از هوش مصنوعی برای پایش هزاران پارامتر، پیش‌بینی خرابی و بهینه‌سازی نگهداری

جایگاه انویدیا در آینده هوش مصنوعی

تمام این ویژگی‌ها نشان می‌دهد انویدیا با تراشه‌های Blackwell و Blackwell Ultra در صدر فناوری هوش مصنوعی قرار دارد. پشتیبانی نرم‌افزاری عمیق، بهینه‌سازی‌های مداوم و سرمایه‌گذاری سالانه در تحقیق و توسعه، این شرکت را برای سال‌های آینده در مسیر پیشتازی حفظ خواهد کرد.

برچسب‌ها: انویدیا, هوش مصنوعی

امتیاز: 5.0 از 5 (2 رای)

کمی صبر کنید...

دیدگاهتان را بنویسید لغو پاسخ

در صورتی که نظر شما حاوی ناسزا، عبارات توهین‌آمیز و تهدید بوده و در تضاد با قوانین فعلی کشور باشد از انتشار آن بدون حذف موارد ذکر شده، معذوریم.
شکلک‌ها (اموجی‌ها) را می‌توانید با کیبرد گوشی یا کیبرد مجازی ویندوز قرار دهید.
تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.

اخبار و مقالات / مطالب گوناگون

انویدیا Blackwell Ultra GB300؛ سریع‌ترین تراشه هوش مصنوعی با بیش از 20000 هسته و حافظه 288 گیگابایت HBM3e

تراشه Blackwell Ultra GB300؛ معجزه انویدیا برای هوش مصنوعی

مشخصات کلی Nvidia Blackwell Ultra GB300

مقایسه Hopper، Blackwell و Blackwell Ultra