شرکت انویدیا جدیدترین مدلهای باز خود را تحت خانواده Nemotron 3 معرفی کرده است که شامل سه اندازه مختلف میشود و عملکرد هوش مصنوعی سریعتری را ارائه میدهد. همچنین پس از لغو ممنوعیتهای صادراتی برای پردازندههای گرافیکی Hopper H200 AI شرکت انویدیا توسط دولت ایالات متحده، این محصول با تقاضای چشمگیری در چین مواجه شده است.
معرفی مدلهای باز هوش مصنوعی Nemotron 3 در اندازههای Nano 30B، Super 100B و Ultra 500B
شرکت انویدیا امروز خانواده Nemotron 3 از مدلهای باز، دادهها و کتابخانهها را با هدف تقویت توسعه شفاف، کارآمد و تخصصی هوش مصنوعی عاملگرا در صنایع مختلف معرفی کرد. مدلهای Nemotron 3 در اندازههای Nano، Super و Ultra معماری ترکیبی نوآورانه نهفته متخصصان (MoE) را معرفی میکنند که به توسعهدهندگان در ساخت و استقرار سیستمهای چندعاملی قابلاعتماد در مقیاس وسیع کمک میکند.

پلتفرم NVIDIA Nemotron از تلاشهای گستردهتر انویدیا در زمینه هوش مصنوعی حاکمیتی پشتیبانی میکند و سازمانهایی از اروپا تا کره جنوبی مدلهای باز، شفاف و کارآمدی را به کار میگیرند که به آنها اجازه میدهد سیستمهای هوش مصنوعی هماهنگ با دادهها، مقررات و ارزشهای خود را بسازند. پذیرندگان اولیه شامل Accenture، Cadence، CrowdStrike، Cursor، Deloitte، EY، Oracle Cloud Infrastructure، Palantir، Perplexity، ServiceNow، Siemens و Zoom در حال ادغام مدلهای خانواده Nemotron برای تقویت گردشهای کاری هوش مصنوعی در زمینه تولید، امنیت سایبری، توسعه نرمافزار، رسانه، ارتباطات و سایر صنایع هستند.
مدلهای باز Nemotron 3 به استارتاپها امکان میدهند تا سریعتر روی عاملهای هوش مصنوعی کار کنند و نوآوری را از مرحله پروتوتایپ تا استقرار سازمانی شتاب بخشند. شرکتهای زیرمجموعه Mayfield در حال بررسی Nemotron 3 برای ساخت همتیمیهای هوش مصنوعی هستند که از همکاری انسان و هوش مصنوعی پشتیبانی میکنند.

تحول هوش مصنوعی چندعاملی با کارایی و دقت توسط Nemotron 3
خانواده مدلهای MoE Nemotron 3 شامل سه اندازه زیر است:
- مدل Nemotron 3 Nano: یک مدل کوچک 30 میلیارد پارامتری با 3 میلیارد پارامتر فعال برای وظایف هدفمند و بسیار کارآمد است.
- مدل Nemotron 3 Super: یک مدل استدلالی با دقت بالا با تقریباً 100 میلیارد پارامتر و 10 میلیارد پارامتر فعال برای کاربردهای چندعاملی است.
- مدل Nemotron 3 Ultra: یک موتور استدلالی بزرگ با حدود 500 میلیارد پارامتر و 50 میلیارد پارامتر فعال برای کاربردهای پیچیده هوش مصنوعی است.
عملکرد و ویژگیهای فنی
مدل Nemotron 3 Nano که امروز در دسترس قرار گرفته است؛ مقرونبهصرفهترین مدل از نظر محاسباتی محسوب میشود و برای وظایف هدفمندی مانند دیباگ نرمافزار، خلاصهسازی محتوا، دستیارهای هوش مصنوعی و بازیابی اطلاعات با هزینههای استنتاج پایین بهینهسازی شده است. این مدل از یک معماری منحصربهفرد ترکیبی MoE استفاده میکند که دستاوردهایی را در کارایی و مقیاسپذیری ارائه میدهد.
این طراحی تا 4 برابر توان عملیاتی توکن بالاتر نسبت به Nemotron 2 Nano را محقق میسازد و تولید توکن استدلال را تا 60 درصد کاهش میدهد که بهطور قابلتوجهی هزینههای استنتاج را پایین میآورد. مدل Nemotron 3 Nano با پنجره زمینه 1 میلیون توکنی، موارد بیشتری را به خاطر میسپارد که آن را دقیقتر و در ارتباط دادن اطلاعات در طول وظایف طولانی و چندمرحلهای توانمندتر میسازد. سازمان مستقل Artificial Analysis که بنچمارک هوش مصنوعی انجام میدهد؛ این مدل را به عنوان بازترین و کارآمدترین مدل در میان مدلهای هماندازه و با دقت پیشرو رتبهبندی کرد.

مدل Nemotron 3 Super در کاربردهایی که به تعداد زیادی عامل همکاریکننده برای انجام وظایف پیچیده با تأخیر کم نیاز دارند، برتری دارد. مدل Nemotron 3 Ultra به عنوان یک موتور استدلالی پیشرفته برای گردشهای کاری هوش مصنوعی عمل میکند که نیازمند تحقیقات عمیق و برنامهریزی استراتژیک هستند.
مدلهای Nemotron 3 Super و Ultra از فرمت آموزش فوقکارآمد 4 بیتی NVFP4 متعلق به انویدیا روی معماری NVIDIA Blackwell استفاده میکنند که نیازهای حافظه را بهطور قابلتوجهی کاهش میدهد و آموزش را سرعت میبخشد. این کارایی اجازه میدهد تا مدلهای بزرگتر بدون به خطر انداختن دقت نسبت به فرمتهایی با دقت بالاتر روی زیرساختهای موجود آموزش داده شوند.
توسعهدهندگان با خانواده مدلهای Nemotron 3 میتوانند مدل بازی را انتخاب کنند که برای بارهای کاری خاص آنها مناسبسازی شده است و در حالی که از استدلال سریعتر و دقیقتر در افق طولانی برای گردشهای کاری پیچیده بهره میبرند، مقیاس آن را از دهها تا صدها عامل افزایش دهند.
شروع کار با مدلهای باز انویدیا
مدل Nemotron 3 Nano امروز روی Hugging Face و از طریق ارائهدهندگان سرویس استنتاج شامل Baseten، Deepinfra، Fireworks، FriendliAI، OpenRouter و Together AI در دسترس است. مدل Nemotron روی پلتفرمهای هوش مصنوعی سازمانی و زیرساخت داده شامل Couchbase، DataRobot، H2O.ai، JFrog، Lambda و UiPath ارائه میشود. Nemotron 3 Nano برای مشتریان در کلادهای عمومی، روی AWS از طریق Amazon Bedrock (بدون سرور) در دسترس خواهد بود و همچنین به زودی در Google Cloud، Coreweave، Nebius، Nscale و Yotta پشتیبانی میشود.

مدل Nemotron 3 Nano به عنوان یک میکروسرویس NVIDIA NIMTM برای استقرار ایمن و مقیاسپذیر در هر مکانی روی زیرساخت شتابدهی شده انویدیا جهت حداکثر حریم خصوصی و کنترل در دسترس است. انتظار میرود مدلهای NVIDIA Nemotron 3 Super و Ultra در نیمه اول سال 2026 در دسترس قرار گیرند.








دیدگاهتان را بنویسید