انویدیا اخیراً از مدل زبان بزرگ (LLM) جدیدی به نام Llama-3.1-Nemotron-70B-Instruct رونمایی کرده که عملکردی فراتر از مدلهای مطرحی چون GPT-4o از OpenAI و Claude 3.5 Sonnet از Anthropic دارد. این مدل در معیارهای متمرکز بر هوش مصنوعی، نتایج برجستهای به دست آورده است.
انویدیا که پیشتر در حوزه سختافزار هوش مصنوعی موفقیتهای چشمگیری کسب کرده بود، اکنون با تمرکز بر مدلهای زبان بزرگ متنباز (Open-Source) و همکاری با متا (Meta)، به دنبال تسلط بیشتر در عرصه هوش مصنوعی است. مدل جدید Llama-3.1-Nemotron-70B-Instruct هنوز بهطور گسترده در رسانهها مطرح نشده، اما بر اساس نتایج اولیه و بنچمارکها، پتانسیل بالایی دارد تا به عنوان مدلی پیشرو در صنعت شناخته شود.
این مدل برای افزایش دقت و تطابق بیشتر با ترجیحات انسانی طراحی شده است، به ویژه در زمینه صحت اطلاعات و حل مسائل پیچیده. انویدیا این مدل را با تکیه بر نسخه پایه Llama-3.1-70B-Instruct متا، که دارای 70 میلیارد پارامتر است، تنظیم و تقویت کرده و تمرکز خاصی بر مفهوم “SteerLM Regression Reward” دارد.
هوش مصنوعی قدرتمند انویدیا
مدل Llama-3.1-Nemotron-70B-Instruct از رویکرد “SteerLM Regression Reward Modelling” بهره میبرد. در این رویکرد، یک تابع پاداش تعریف میشود که فرآیند یادگیری مدل را از طریق مدلهای رگرسیون هدایت میکند و دادهها را دقیقتر و پاسخها را واضحتر میسازد. این ویژگی باعث افزایش کیفیت دادهها و پیچیدگی مدل میشود و در نهایت پاسخهایی بهینه و مطابق با نیازهای کاربران ارائه میدهد.
یکی از نکات جالب این مدل، توانایی آن در حل مسئلهای است که مدلهای سنتی هوش مصنوعی از حل آن ناتوان بودند؛ به عنوان مثال، مسئله “توتفرنگی” که شامل شمارش تعداد حرف “R” در کلمه “strawberry” است. این تنها یکی از دستاوردهای مدل نیست و اطلاعات بیشتر در آینده منتشر خواهد شد. مدل Llama-3.1-Nemotron-70B-Instruct همچنین در بنچمارکهای متعددی، از جمله Arena Hard که ابزاری برای ارزیابی خودکار مدلهای زبان تنظیم شده است، به رتبههای برتر دست یافته است.
نکته مهم این است که Llama-3.1-Nemotron-70B-Instruct توانسته مدلهای پیشرویی مانند GPT-4o را پشت سر بگذارد. این موفقیت بهویژه با توجه به تأثیرات تنظیمات انویدیا بر نسخه پایه Llama-3.1-70B-Instruct متا، بسیار مهم است. هرچند هنوز عملکرد مدل در وظایف خاص مانند کدنویسی پیچیده یا حل مسائل مبتنی بر استنتاج آزمایش نشده، اما نتایج اولیه نشان میدهد که این مدل تواناییهای لازم برای مواجهه با چالشهای پیچیده را دارد.
اگر به دسترسی به این مدل علاقهمندید، میتوانید آن را از پلتفرم “NIM” انویدیا دریافت کنید یا نسخهای از آن را در HuggingFace بیابید. انویدیا در مسیر تسلط بر صنعت هوش مصنوعی قرار گرفته و به نظر میرسد بخشهای کلیدی این صنعت را در آینده در دست خواهد گرفت.
مطالب مرتبط:
دیدگاهتان را بنویسید