شرکت AMD بهصورت رسمی سری جدید گرافیکهای هوش مصنوعی و محاسباتی خود با نام Instinct MI350 را معرفی کرده است؛ این سری شامل مدلهای MI350X و پرچمدار MI355X بوده و تا 185 میلیارد ترانزیستور را در خود جای داده است. این گرافیکها بر پایه معماری CDNA 3 و با فناوری ساخت 3 نانومتری شرکت TSMC تولید شدهاند.

آغاز نسل جدید پردازش هوش مصنوعی با AMD Instinct MI350
تراشههای MI350X و MI355X در دو نسخه با خنککننده هوایی و مایع عرضه میشوند. این مدلها از نوعهای دادهای هوش مصنوعی FP6 و FP4 پشتیبانی کرده و به حافظه فوقسریع HBM3E با ظرفیت 288 گیگابایت مجهز هستند. برای مقایسه، تراشههای B300 شرکت انویدیا که با فرآیند 4 نانومتری TSMC ساخته شدهاند تا 208 میلیارد ترانزیستور دارند.

در زمینه توان پردازشی هوش مصنوعی، AMD اعلام کرده است که سری MI350 توان پردازشی 20 پتافلاپس FP4/FP6 ارائه میدهد؛ این مقدار نسبت به نسل قبل 4 برابر افزایش داشته است. همچنین این تراشهها به استاندارد جدید UBB8 برای استقرار سریع زیرساختهای هوش مصنوعی مجهز شدهاند که موجب تسریع در راهاندازی نودهای خنکشونده با هوا یا مایع میشود.

مشخصات MI355X در مقایسه با رقبا
بر اساس اطلاعات ارائهشده توسط AMD، مدل MI355X دارای پهنای باند حافظه تجمیعی 8 ترابایت بر ثانیه، توان پردازشی 79 ترافلاپس برای FP64، توان پردازشی 5 پتافلاپس برای FP16، توان پردازشی 10 پتافلاپس برای FP8 و 20 پتافلاپس برای FP6/FP4 است. این مقادیر مربوط به پیکربندی 1400 وات MI355X هستند. هر دو مدل MI350X و MI355X از قالب تراشه یکسانی استفاده میکنند؛ اما MI355X دارای توان مصرفی بالاتری است.

در مقایسه با B200:
- حافظه: 1.6 برابر بیشتر
- پهنای باند: برابر
- FP64: حدود 2.1 برابر بیشتر
- FP16: حدود 1.1 برابر بیشتر
- FP8: حدود 1.1 برابر بیشتر
- FP6: حدود 2.2 برابر بیشتر
- FP4: حدود 1.1 برابر بیشتر
در مقایسه با GB200:
- حافظه: 1.6 برابر بیشتر
- پهنای باند: برابر
- FP64: حدود 2 برابر بیشتر
- FP16: برابر
- FP8: برابر
- FP6: حدود 2 برابر بیشتر
- FP4: برابر
در مقایسه با سری MI300، شرکت AMD جهشی 35 برابری در عملکرد استنتاج را با استفاده از مدل Llama 3.1 405B به نمایش گذاشته است که افزایش چشمگیری به شمار میرود.

توان پردازشی در سطح پلتفرم
در سطح کامل پلتفرم MI350، اکوسیستم جدید Instinct امکان استفاده از حداکثر 8 گرافیک MI355 را با 2.3 ترابایت حافظه HBM3E و 64 ترابایت بر ثانیه پهنای باند فراهم میکند. در این پیکربندی، توان پردازشی 0.63 پتافلاپس برای FP64، توان پردازشی 81 پتافلاپس برای FP8 و 161 پتافلاپس برای FP6/FP4 ارائه میگردد.

در یک رک کامل با خنککننده مایع، بین 128 تا 96 گرافیک MI350 میتوان نصب کرد که حداکثر 36 ترابایت حافظه HBM3E، حدود 2.6 اگزافلاپس توان پردازشی FP4 و 1.3 اگزافلاپس توان FP8 فراهم میکند؛ این سیستم از پردازندههای EPYC نسل Turin با معماری Zen 5 و راهکار ارتباطی Pollara 400 بهره میبرد.

عملکرد در آزمونهای هوش مصنوعی
در آزمونهای متعدد هوش مصنوعی که توسط AMD ارائه شده، عملکرد MI355X نسبت به MI300X در بازه 2.8 تا 4.2 برابر بهبود یافته است.

همچنین در مقایسه با حجم کاری محبوبی همچون DeepSeek R1، Llama 4 و Llama 3.1، گرافیک MI355X عملکرد بهمراتب بالاتری نسبت به سری MI300X از خود نشان داده است.

مقایسه قیمت به عملکرد
در حالت FP4 و هنگام استفاده از مدل Llama 3.1 405B، عملکرد گرافیک MI355X برابر با سرور گرانقیمت Blackwell GB200 شرکت انویدیا است که نشاندهنده برتری AMD در هدفگذاری نسبت قیمت به عملکرد است. AMD همچنین اعلام کرده که گرافیکهای MI350 میتوانند تا 40 درصد توکن بیشتری به ازای هر درصد هزینه نسبت به راهکار B200 شرکت انویدیا تولید کنند.

عرضه و آینده محصولات
در حالی که سری MI350 امروز معرفی شده، عرضه آن از فصل سوم 2025 از طریق شرکای مختلف آغاز خواهد شد. همچنین AMD تایید کرده که توسعه سری MI400 در جریان است و عرضه آن برای سال 2026 برنامهریزی شده است.
نام شتابدهنده | AMD Instinct MI400 | AMD Instinct MI350X | AMD Instinct MI325X | AMD Instinct MI300X | AMD Instinct MI250X |
معماری گرافیک | CDNA Next / UDNA | CDNA 4 | Aqua Vanjaram (CDNA 3) | Aqua Vanjaram (CDNA 3) | Aldebaran (CDNA 2) |
فناوری ساخت گرافیک | نامشخص | 3 نانومتر | 5 و 6 نانومتر | 5 و 6 نانومتر | 6 نانومتر |
چیپلت (XCDs) | 8 عدد (MCM) | 8 عدد (MCM) | 8 عدد (MCM) | 8 عدد (MCM) | 2 عدد (MCM)؛ 1 عدد در هر قالب |
هستههای گرافیکی | نامشخص | نامشخص | 19456 | 19456 | 14080 |
فرکانس گرافیک | نامشخص | نامشخص | 2100 مگاهرتز | 2100 مگاهرتز | 1700 مگاهرتز |
توان محاسباتی INT8 | نامشخص | نامشخص | 2614 تریلیون عملیات در ثانیه | 2614 تریلیون عملیات در ثانیه | 383 تریلیون عملیات در ثانیه |
توان محاسباتی FP6/FP4 | نامشخص | 20 پتافلاپس | ندارد | ندارد | ندارد |
توان محاسباتی FP8 | نامشخص | 10 پتافلاپس | 2.6 پتافلاپس | 2.6 پتافلاپس | ندارد |
توان محاسباتی FP16 | نامشخص | 5 پتافلاپس | 1.3 پتافلاپس | 1.3 پتافلاپس | 383 ترافلاپس |
توان محاسباتی FP32 | نامشخص | نامشخص | 163.4 ترافلاپس | 163.4 ترافلاپس | 95.7 ترافلاپس |
توان محاسباتی FP64 | نامشخص | 79 ترافلاپس | 81.7 ترافلاپس | 81.7 ترافلاپس | 47.9 ترافلاپس |
حافظه گرافیکی (VRAM) | نامشخص | 288 گیگابایت HBM3E | 256 گیگابایت HBM3E | 192 گیگابایت HBM3 | 128 گیگابایت HBM2E |
حافظه کش Infinity | نامشخص | نامشخص | 256 مگابایت | 256 مگابایت | ندارد |
سرعت حافظه | نامشخص | 8.0 گیگابیت بر ثانیه | 5.9 گیگابیت بر ثانیه | 5.2 گیگابیت بر ثانیه | 3.2 گیگابیت بر ثانیه |
پهنای باس حافظه | نامشخص | 8192 بیت | 8192 بیت | 8192 بیت | 8192 بیت |
پهنای باند حافظه | نامشخص | 8 ترابایت بر ثانیه | 6.0 ترابایت بر ثانیه | 5.3 ترابایت بر ثانیه | 3.2 ترابایت بر ثانیه |
فرم فاکتور | نامشخص | OAM | OAM | OAM | OAM |
نوع خنککننده | نامشخص | خنککننده غیرفعال | خنککننده غیرفعال | خنککننده غیرفعال | خنککننده غیرفعال |
توان مصرفی (حداکثر) | نامشخص | 1400 وات (مدل 355X) | 1000 وات | 750 وات | 560 وات |
دیدگاهتان را بنویسید