شرکت AMD این بار دادههای جالبی را در مورد قابلیتهای سختافزار گرافیک RDNA 3 و XDNA NPU خود در بارهای کاری هوش مصنوعی مصرفکننده محور به اشتراک گذاشته است.
بر اساس این اطلاعات، گرافیکهای RDNA 3 و NPU XDNA شرکت AMD مجموعهای قوی از قابلیتهای هوش مصنوعی مبتنی بر مصرفکننده را در پلتفرمهای PC ارائه میکنند.
شکی نیست که شرکت AMD در ارائه گستردهتر قابلیتهای هوش مصنوعی به مخاطبان PCها از طریق پیادهسازی XDNA NPU بر روی APUهای Ryzen خود پیشتاز بوده است. اولین NPU در سال 2023 با APUهای Phoenix Ryzen 7040 به بازار عرضه شد و به تازگی با سری Hawk Point Ryzen 8040 آپدیت شده است. علاوه بر NPU، معماری پردازنده گرافیکی RDNA 3 شرکت AMD تعداد زیادی از هستههای هوش مصنوعی اختصاصی را نیز در خود جای داده است که میتوانند این حجمهای کاری را مدیریت کنند. علاوه بر این شرکت AMD در تلاش است تا با ارائه مجموعه نرمافزاری ROCm حرکت خود را تقویت کند.
در طی آخرین وبینار Meet The Experts، شرکت AMD در مورد اینکه چگونه مجموعه کارت گرافیکهای Radeon خود مانند سری RDNA 3 طیف وسیعی از بارهای کاری بهینه شده را در اختیار گیمرها، سازندگان و توسعه دهندگان قرار میدهد، بحث کرد:
- افزایش کیفیت ویدیو
- حذف نویز پس زمینه
- متن به تصویر (GenAI)
- مدلهای زبان بزرگ (GenAI)
- ویرایش عکس
- ویراش ویدیو
- ارتقاء مقیاس
- تبدیل متن به تصویر
- آموزش مدل (لینوکس)
- بستر ROCm (لینوکس)
با ظهور معماری گرافیکی AMD RDNA 3، آخرین چیپهای گرافیکی که در کارت گرافیکهای Radeon RX 7000 و پردازندههای Ryzen 7000/8000 ارائه میشوند، بیش از 2 برابر افزایش عملکرد هوش مصنوعی نسل به نسل را ارائه میکنند.
این محصولات گرافیکی حداکثر 192 شتاب دهنده هوش مصنوعی را ارائه میدهند که برای بارهای کاری FP16 در چارچوبهای ML متعدد مانند Microsoft DirectML، Nod.AI Shark و ROCm بهینه شدهاند و دارای ظرفیتهای بزرگی از VRAM اختصاصی هستند که برای مدیریت مجموعه دادههای بزرگ (تا 48 گیگابایت) ضروری خواهد بود. همچنین از پهنای باند سریع تر پشتیبانی میکند که با فناوری Infinity Cache تقویت شده است.
به گفته شرکت AMD، اکثر موارد استفاده از هوش مصنوعی در پلتفرم PCها شامل مدلهای LLM و Diffusion خواهند بود که عمدتاً به محاسبات FP16 و قابلیتهای حافظه سختافزاری که روی آن اجرا میشوند وابسته هستند. مدلهای خاصی مانند SDXL (Diffusion) توسط Compute محدود میشوند و به حدود 4-16 گیگابایت حافظه نیاز دارند در حالی که Llama2-13B و Mistral-8x 7B توسط حافظه محدود شدهاند و میتوانند حداکثر 23 گیگابایت حافظه را اشغال کنند.
همانطور که قبلا ذکر شد، کمپانی AMD دارای طیف گستردهای از سخت افزار است که از شتاب هوش مصنوعی اختصاصی پشتیبانی میکنند. حتی کارت گرافیکهای Radeon RX 7600 XT این شرکت، که یک نسخه 329 دلاری محسوب میشود، دارای 16 گیگابایت VRAM است و از نظر عملکرد، افزایش 3.6 برابری نسبت به Ryzen 7 8700G در LM Studio ارائه میدهد در حالی که نسخه RX 7900 XT تا 8 برابر سریعتر از مدل 8700G است.
عملکرد LM Studio (بالاتر بهتر است):
- NPU Ryzen 7 8700G: برابر با 11 توکن در ثانیه
- RX 7600 XT 16 GB: برابر با 40 توکن در ثانیه
- RX 7900 XT 20 GB: برابر با 85 توکن در ثانیه
AMUSE Diffusion (کمتر بهتر است):
- NPU Ryzen 7 8700G: برابر با 2.6 ثانیه/تصویر
- RX 7600 XT 16 GB: برابر با 0.97 ثانیه/تصویر
- RX 7900 XT 20 GB: برابر با 0.6 ثانیه/تصویر
شرکت AMD همچنین مقایسه کوچکی با کارت گرافیکهای GeForce RTX انجام میدهد که شرکت انویدیا آن را پلتفرم Premium AI PC مینامد. هر دو سری پشتیبانی مشابهی ارائه میکنند، اما شرکت AMD نشان میدهد که چگونه کارت گرافیک 16 گیگابایتی آنها با قیمت 329 دلار (یعنی نسخه 7600 XT) به بازار عرضه میشوند، در حالی که بها تمام شده پایین ردهترین کارت گرافیک کمپانی انویدیا با ظرفیت 16 گیگابایت از حدود 500 دلار آمریکا (یعنی نسخه 4060 TI 16 GB) شروع میشود. این شرکت همچنین دارای یک محصول رده بالا است که تا 48 گیگابایت حافظه را پشتیبانی میکند. همچنین شرکت AMD قبلاً عملکرد قویتری در برابر پردازندههای Core Ultra کمپانی اینتل در هوش مصنوعی، با قیمت بهتر نشان داده است.
در حرکت رو به جلو، شرکت AMD در مورد چگونگی پیشرفت ROCm 6.0 و نحوه پشتیبانی پکیجهای منبع باز از سخت افزارهای سطح مصرف کننده مانند Radeon RX 7900 XTX، 7900 XT، 7900 GRE، PRO W7900 و PRO W7800 صحبت میکند. ROCm 6.0 از مدلها و الگوریتمهای PyTorch و ONNX Runtime ML در سیستمعامل Ubuntu 22.03.3 (Linux) پشتیبانی خواهد کرد و با افزودن INT8 برای مدلهای پیچیدهتر، قابلیت همکاری را بهبود میبخشد.
این شرکت همچنین در تلاش است تا ROCm را با ارائه مجموعهای از پکیجهای نرمافزار و اسناد سختافزاری به توسعه دهندگان، منبع بازتر کند.
شرکت AMD و مجموعه ROCm آن در حال رقابت با پکیج غالب CUDA و TensorRT کمپانی انویدیا هستند در حالی که اینتل نیز با پکیج OneAPI AI خود در حال پیشرفت است. اینها سه نیرویی هستند که باید در مورد بارهای کاری هوش مصنوعی در پلتفرم PC به آنها توجه کنید، بنابراین در آینده منتظر نوآوریها و بهینه سازیهای زیادی برای سخت افزارهای موجود و نسل بعدی باشید.
مطالب مرتبط:
دیدگاهتان را بنویسید