انویدیا از مدل زبانی Llama-3.1-Nemotron-70B-Instruct رونمایی کرد: قدرتمندتر از GPT-4o

توسط وحید دلشاد ·28 مهر 140328 مهر 1403· 0

انویدیا اخیراً از مدل زبان بزرگ (LLM) جدیدی به نام Llama-3.1-Nemotron-70B-Instruct رونمایی کرده که عملکردی فراتر از مدل‌های مطرحی چون GPT-4o از OpenAI و Claude 3.5 Sonnet از Anthropic دارد. این مدل در معیارهای متمرکز بر هوش مصنوعی، نتایج برجسته‌ای به دست آورده است.

انویدیا که پیش‌تر در حوزه سخت‌افزار هوش مصنوعی موفقیت‌های چشمگیری کسب کرده بود، اکنون با تمرکز بر مدل‌های زبان بزرگ متن‌باز (Open-Source) و همکاری با متا (Meta)، به دنبال تسلط بیشتر در عرصه هوش مصنوعی است. مدل جدید Llama-3.1-Nemotron-70B-Instruct هنوز به‌طور گسترده در رسانه‌ها مطرح نشده، اما بر اساس نتایج اولیه و بنچمارک‌ها، پتانسیل بالایی دارد تا به عنوان مدلی پیشرو در صنعت شناخته شود.

این مدل برای افزایش دقت و تطابق بیشتر با ترجیحات انسانی طراحی شده است، به ویژه در زمینه صحت اطلاعات و حل مسائل پیچیده. انویدیا این مدل را با تکیه بر نسخه پایه Llama-3.1-70B-Instruct متا، که دارای 70 میلیارد پارامتر است، تنظیم و تقویت کرده و تمرکز خاصی بر مفهوم “SteerLM Regression Reward” دارد.

هوش مصنوعی قدرتمند انویدیا

مدل Llama-3.1-Nemotron-70B-Instruct از رویکرد “SteerLM Regression Reward Modelling” بهره می‌برد. در این رویکرد، یک تابع پاداش تعریف می‌شود که فرآیند یادگیری مدل را از طریق مدل‌های رگرسیون هدایت می‌کند و داده‌ها را دقیق‌تر و پاسخ‌ها را واضح‌تر می‌سازد. این ویژگی باعث افزایش کیفیت داده‌ها و پیچیدگی مدل می‌شود و در نهایت پاسخ‌هایی بهینه و مطابق با نیازهای کاربران ارائه می‌دهد.

یکی از نکات جالب این مدل، توانایی آن در حل مسئله‌ای است که مدل‌های سنتی هوش مصنوعی از حل آن ناتوان بودند؛ به عنوان مثال، مسئله “توت‌فرنگی” که شامل شمارش تعداد حرف “R” در کلمه “strawberry” است. این تنها یکی از دستاوردهای مدل نیست و اطلاعات بیشتر در آینده منتشر خواهد شد. مدل Llama-3.1-Nemotron-70B-Instruct همچنین در بنچمارک‌های متعددی، از جمله Arena Hard که ابزاری برای ارزیابی خودکار مدل‌های زبان تنظیم شده است، به رتبه‌های برتر دست یافته است.

نکته مهم این است که Llama-3.1-Nemotron-70B-Instruct توانسته مدل‌های پیشرویی مانند GPT-4o را پشت سر بگذارد. این موفقیت به‌ویژه با توجه به تأثیرات تنظیمات انویدیا بر نسخه پایه Llama-3.1-70B-Instruct متا، بسیار مهم است. هرچند هنوز عملکرد مدل در وظایف خاص مانند کدنویسی پیچیده یا حل مسائل مبتنی بر استنتاج آزمایش نشده، اما نتایج اولیه نشان می‌دهد که این مدل توانایی‌های لازم برای مواجهه با چالش‌های پیچیده را دارد.

اگر به دسترسی به این مدل علاقه‌مندید، می‌توانید آن را از پلتفرم “NIM” انویدیا دریافت کنید یا نسخه‌ای از آن را در HuggingFace بیابید. انویدیا در مسیر تسلط بر صنعت هوش مصنوعی قرار گرفته و به نظر می‌رسد بخش‌های کلیدی این صنعت را در آینده در دست خواهد گرفت.

مطالب مرتبط:

برچسب‌ها: انویدیا

امتیاز: 5.0 از 5 (2 رای)

کمی صبر کنید...

دیدگاهتان را بنویسید لغو پاسخ

در صورتی که نظر شما حاوی ناسزا، عبارات توهین‌آمیز و تهدید بوده و در تضاد با قوانین فعلی کشور باشد از انتشار آن بدون حذف موارد ذکر شده، معذوریم.
شکلک‌ها (اموجی‌ها) را می‌توانید با کیبرد گوشی یا کیبرد مجازی ویندوز قرار دهید.
تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.