انویدیا از جدیدترین راهکار Blackwell GB200 NVL4 رونمایی کرد، سیستمی که چهار پردازنده گرافیکی و دو پردازنده مرکزی را در یک پلتفرم قدرتمند برای محاسبات پیشرفته (HPC) و هوش مصنوعی ترکیب میکند. سیستم قدرتمند انویدیا GB200 NVL4 نشان از قدرت بسیار بالای انویدیا در حوزه هوش مصنوعی نسبت به سالهای گذشته است.
در رویداد SC24، انویدیا از دو پلتفرم سختافزاری جدید پرده برداشت. یکی از این پلتفرمها بر پایه فناوری پیشرفته Blackwell و دیگری مبتنی بر معماری Hopper طراحی شده است. این راهکارها برای سرورهای سازمانی بهینهسازی شدهاند و هدف آنها تسریع بارهای کاری سنگین در حوزه HPC و هوش مصنوعی است.
انویدیا با معرفی کارتهای H200 NVL اعلام کرد که این کارتهای مبتنی بر معماری PCIe Hopper اکنون برای استفاده عمومی در دسترس هستند. این کارتها قادرند تا چهار پردازنده گرافیکی را از طریق یک دامنه NVLINK به هم متصل کنند و پهنای باندی هفت برابر بیشتر از راهکارهای استاندارد PCIe ارائه دهند.
انعطافپذیری سیستم انویدیا GB200 NVL4
به گفته انویدیا، راهکارهای H200 NVL با هر مرکز دادهای سازگار هستند و مجموعهای از پیکربندیهای سرور انعطافپذیر را در اختیار قرار میدهند که بهطور ویژه برای بارهای کاری ترکیبی محاسبات پیشرفته (HPC) و هوش مصنوعی طراحی و بهینهسازی شدهاند. از نظر مشخصات فنی، راهکار Hopper H200 NVL با 1.5 برابر افزایش در حافظه HBM، حدود 1.7 برابر بهبود در عملکرد استنتاج مدلهای زبانی بزرگ (LLM) و 1/3 برابر ارتقا در عملکرد محاسبات پیشرفته (HPC) همراه است.
این GPU از 114 واحد پردازشی (SM)، 14.592 هسته CUDA و 456 هسته Tensor و توان پردازشی تا 3 ترافلاپس در حالت FP8 (با جمعآوری FP16) بهره میبرد. همچنین، مجهز به 80 گیگابایت حافظه HBM2e با رابط 5120 بیتی است و توان مصرفی (TDP) آن 350 وات تعیین شده است.
ماژول جدید انویدیا GB200 NVL4 که نسخهای بزرگتر و پیشرفتهتر از راهکار اصلی GB200 Grace Blackwell Superchip AI به شمار میرود، بهتازگی معرفی شده است. این ماژول با دو برابر شدن توان پردازشی CPU و GPU، همچنین حافظه بیشتری را در اختیار کاربران قرار میدهد.
ساختار این ماژول شامل دو پردازنده گرافیکی Blackwell GB200 و دو پردازنده مرکزی Grace است که روی بردی بزرگتر طراحی شدهاند. این راهکار تکسروری از یک دامنه NVLINK چهار پردازندهای و 1.3 ترابایت حافظه همگن بهره میبرد. از لحاظ عملکرد، ماژول GB200 NVL4 2.2 برابر در شبیهسازی و 1.8 برابر در آموزش و استنتاج (Training & Inference) بهبود ایجاد میکند. این راهکار قرار است طی ماههای آینده توسط شرکای تجاری انویدیا عرضه شود.
در رابطه با توان مصرفی (TDP)، با توجه به اینکه ماژول Superchip حدود 2700 وات انرژی مصرف میکند، میتوان پیشبینی کرد که راهکار بزرگتر GB200 NVL4 تقریباً 6 کیلووات برق مصرف خواهد کرد. این موضوع بهخوبی نشاندهنده تلاشهای انویدیا برای تسریع و پیشبرد محاسبات هوش مصنوعی است.
این شرکت بهتازگی رکوردهای جهانی جدیدی در MLPerf v4.1 در حوزههای آموزش و استنتاج به ثبت رسانده است. این دستاورد تنها به دلیل توانمندیهای فوقالعاده Blackwell نیست، بلکه Hopper نیز با بهینهسازیهای مداوم خود، بهبود عملکرد چشمگیری داشته است. علاوه بر این، شرکت در حال تسریع نقشهراه هوش مصنوعی خود به یک دوره یکساله است و برنامههای زیادی برای توسعه زیرساختهای جدید در سالهای آینده دارد، از جمله Blackwell Ultra و Rubin جدیدترین پروژههای انویدیا به شمار میروند.
مطالب مرتبط:
دیدگاهتان را بنویسید