اخبار جدید حاکی از آن است که شرکت انویدیا با آخرین نسخه درایور R555، عملکرد هوش مصنوعی کارت گرافیکهای GeForce RTX و پلتفرمهای PC RTX AI خود را افزایش داده است.
به عبارتی دیگر، کارت گرافیکهای GeForce RTX و PCهای RTX شرکت انویدیا سریعترین عملکرد هوش مصنوعی را در تمام بخشها ارائه خواهند داد که اکنون با جدیدترین درایورها 3 برابر شده است.
در طی رویداد Build شرکت مایکروسافت، کمپانی انویدیا به معرفی یک سری بهینهسازیهای عملکرد هوش مصنوعی جدید پرداخت که اکنون در پلتفرم RTX شامل کارت گرافیکها، ورکاستیشنها و PCهای GeForce RTX دسترس است.
شرکت انویدیا چگونه عملکرد هوش مصنوعی خود را افزایش داده است؟
بهینهسازیهای جدید بهطور خاص طیفی از LLM (مدلهای زبان بزرگ) را هدف قرار دادهاند که آخرین تجربیات هوش مصنوعی مولد را تقویت خواهند کرد. با استفاده از جدیدترین درایورهای R555، پردازندههای گرافیکی RTX و پلتفرمهای PC هوش مصنوعی انویدیا اکنون با ONNX Runtime (ORT) و DirectML عملکرد هوش مصنوعی را تا 3 برابر سریعتر ارائه میدهند. این دو ابزار برای اجرای مدلهای هوش مصنوعی به صورت محلی در PCهای ویندوزی استفاده میشوند.
علاوه بر آن، WebNN با RTX از طریق DirectML نیز تسریع شده است. این یک رابط برنامه نویسی کاربردی برای توسعه دهندگان وب به منظور استقرار مدلهای جدید هوش مصنوعی محسوب میشود. همچنین شرکت مایکروسافت برای تسریع بیشتر عملکرد گرافیک RTX و در عین حال افزودن پشتیبانی DirectML در PyTorch با کمپانی انویدیا همکاری میکند. در زیر لیست کاملی از قابلیتهایی که درایورهای جدید R555 برای کارت گرافیکهای GeForce RTX و PCهای RTX ارائه میدهند، آورده شده است:
- پشتیبانی از DQ-GEMM metacommand به منظور مدیریت کوانتیزاسیون وزن INT4 برای LLMها
- روشهای نرمالسازی جدید RMSNorm برای مدلهای Llama 2، Llama 3، Mistral و Phi-3
- مکانیسمهای multi-query attention و sliding window attention برای پشتیبانی از Mistral
- آپدیت KV در محل برای بهبود عملکرد توجه
- پشتیبانی از GEMM برای تانسورهای غیر ضربشده در 8 به منظور بهبود عملکرد فاز context
در بنچمارکهای عملکرد ORT، که یک برنامه افزودنی مولد هوش مصنوعی محسوب میشود که توسط کمپانی مایکروسافت منتشر شده است، شرکت انویدیا در هر دو نوع داده INT4 و FP16 دستاوردهای گستردهای را به نمایش میگذارد. به لطف تکنیکهای بهینه سازی اضافه شده در این برنامههای افزودنی برای LLMهایی مانند Phi-3، Llama 3، Gemma و Mistral، عملکرد تا 3 برابر ارتقا یافته است.
علاوه بر این پیشرفتها، شرکت انویدیا با مجموعه قدرتمند TensorRT و TensorRT-LLM خود، در حوزه PCهای هوش مصنوعی مصرفکننده پیشرو بوده است. علاوه بر آن، شرکت انویدیا طیف متنوعی از محصولات را عرضه میکند که توسط سختافزار هوش مصنوعی گنجانده شده در پردازندههای گرافیکی خود مانند هستههای Tensor ارائه میشوند.
این گزینهها شامل فناوری تغییر دهنده بازی DLSS Super Resolution ،NVIDIA ACE ،RTX Remix ، Omniverse ، Broadcast ، RTX Video و چندین فناوری دیگر است. گرافیکهای شرکت انویدیا حداکثر 1300 تراشه محاسباتی هوش مصنوعی را ارائه میکنند که مایلها جلوتر از سریعترین تراشههایی هستند که امسال به بازار عرضه خواهند شد و تنها انتظار میرود به بیشتر از 100 تراشه برسند. علاوه بر آن، این PCها مجهز به جدیدترین پردازندههای گرافیکی RTX شرکت انویدیا خواهند بود که به پلتفرم کامپیوترهای شخصی RTX AI کمک میکند و بخش هوش مصنوعی را در فضا مصرفکننده بیشتر به پیش میراند.
مطالب مرتبط:
دیدگاهتان را بنویسید