آنتروپیک (Anthropic) از مدل هوش مصنوعی پیشرفتهای به نام Claude 3.7 Sonnet رونمایی کرده که برای «فکر کردن» به سوالات تا هر مدت که کاربر بخواهد طراحی شده است.
این شرکت Claude 3.7 Sonnet را اولین مدل ترکیبی استدلال هوش مصنوعی در صنعت مینامد، چرا که این مدل قادر است هم به صورت آنی پاسخ دهد و هم پاسخهایی با تفکر عمیقتر و دقیقتر ارائه دهد. کاربران میتوانند قابلیت استدلال این مدل هوش مصنوعی را فعال کنند تا Claude 3.7 Sonnet برای مدتی کوتاه یا طولانی درباره سوالات فکر کند.
این مدل بخشی از تلاش گسترده آنتروپیک برای سادهسازی تجربه کاربری محصولات هوش مصنوعیاش است. اکثر چتباتهای هوش مصنوعی فعلی گزینههای پیچیدهای برای انتخاب مدل ارائه میدهند که کاربران را مجبور میکند بین گزینههایی با هزینه و قابلیتهای متفاوت تصمیمگیری کنند. از آن طرف، آنتروپیک قصد دارد این فرآیند را ساده کند تا یک مدل همه کارها را انجام دهد.
ویژگیهای مدل Claude 3.7 Sonnet
این مدل از روز دوشنبه برای همه کاربران و توسعهدهندگان دردسترس خواهد بود. با این حال، تنها افرادی که از پلنهای پریمیوم چتبات Claude استفاده میکنند، به قابلیتهای استدلال این مدل دسترسی خواهند داشت. کاربران نسخه رایگان Claude تنها به نسخه استاندارد و بدون قابلیت استدلال مدل Claude 3.7 Sonnet دسترسی خواهند داشت که آنتروپیک ادعا میکند از مدل پیشین خود یعنی Claude 3.5 Sonnet بهتر عمل میکند (این شرکت از شمارههای وسط صرفنظر کرده است).
هزینه استفاده از Claude 3.7 Sonnet برای ورودیها $3 به ازای هر 1 میلیون توکن ورودی (تقریباً معادل 750,000 کلمه) و برای خروجیها $15 به ازای هر 1 میلیون توکن خروجی است. این هزینه نسبت به مدلهای OpenAI’s o3-mini (با هزینه $1.10 برای 1 میلیون توکن ورودی و $4.40 برای 1 میلیون توکن خروجی) و DeepSeek’s R1 (با هزینه $0.55 برای ورودی و $2.19 برای خروجی) بالاتر است. اما باید توجه داشت که مدلهای o3-mini و R1 تنها مدلهای استدلالی هستند و قابلیت ترکیبی مانند Claude 3.7 Sonnet ندارند.
آینده مدلهای هوش مصنوعی ترکیبی
آنتروپیک امیدوار است که Claude در آینده بتواند بدون نیاز به تنظیمات دستی از سوی کاربران، خود تصمیم بگیرد که چه مدت باید روی سوالات فکر کند.
به گفته Dianne Penn، مدیر محصول و تحقیقات آنتروپیک، این شرکت معتقد است همانطور که انسانها دو مغز جداگانه برای پاسخهای سریع و پاسخهای نیازمند فکر کردن ندارند، استدلال یکی از قابلیتهای اصلی مدل های هوش مصنوعی پیشرفته است و باید بهصورت یکپارچه با دیگر تواناییها ارائه شود، نه در قالب مدلی جداگانه.
Claude 3.7 Sonnet به کاربران امکان مشاهده فرآیند تفکر داخلی خود را از طریق یک پلتفرم شفافسازی میدهد. با این حال، بخشهایی از این فرآیند ممکن است به دلایل امنیتی و اعتماد حذف شوند.

این مدل برای وظایف واقعی، مانند حل مسائل پیچیده کدنویسی یا انجام وظایف هوشمندانه طراحی شده است. توسعهدهندگان میتوانند از طریق API، بودجه تفکر را تنظیم کرده و بین سرعت، هزینه و کیفیت پاسخ تعادل برقرار کنند.
در آزمون SWE-Bench که توانایی مدل در حل مسائل واقعی کدنویسی را میسنجد، Claude 3.7 Sonnet با دقت 62.3% عمل کرد، در حالی که مدل OpenAI o3-mini تنها 49.3% دقت داشت.
در آزمون دیگری به نام TAU-Bench که توانایی تعامل مدل با کاربران شبیهسازیشده و APIهای خارجی در محیطهای خردهفروشی را ارزیابی میکند، Claude 3.7 Sonnet امتیاز 81.2% را به دست آورد، در حالی که مدل OpenAI o1 تنها موفق به کسب 73.5% امتیاز شد.
آنتروپیک ادعا میکند Claude 3.7 Sonnet در مقایسه با مدلهای قبلی خود کمتر از پاسخگویی امتناع میکند. این مدل میتواند تفاوتهای ظریف بین درخواستهای مضر و بیضرر را بهتر تشخیص دهد. آنتروپیک توانسته تعداد ممانعتهای غیرضروری را نسبت به Claude 3.5 Sonnet حدود 45% کاهش دهد. این موضوع در زمانی مطرح میشود که بسیاری از آزمایشگاههای هوش مصنوعی در حال بازنگری رویکرد خود در محدودکردن پاسخهای چتباتها هستند.
معرفی ابزار جدید Claude Code
آنتروپیک همراه با Claude 3.7 Sonnet، ابزار کدنویسی جدیدی به نام Claude Code را بهصورت پیشنمایش تحقیقاتی عرضه میکند.
در یک نسخه نمایشی، کارکنان آنتروپیک نشان دادند که چگونه Claude Code میتواند با دستوری ساده مانند «ساختار این پروژه را توضیح بده» یک پروژه کدنویسی را تحلیل کند. این ابزار میتواند یک کدبیس را با استفاده از دستورات انگلیسی ساده تغییر داده، تغییرات را توضیح دهد، پروژه را برای یافتن خطاها تست کرده و حتی آن را به یک مخزن گیتهاب ارسال کند. این ابزار در ابتدا تنها برای تعداد محدودی از کاربران و بر اساس اولویت دردسترس خواهد بود.
عرضه Claude 3.7 Sonnet در زمانی صورت میگیرد که آزمایشگاههای هوش مصنوعی مدلهای جدید را با سرعتی بیسابقه عرضه میکنند. آنتروپیک که در گذشته رویکردی محتاطانه و متمرکز بر ایمنی را اتخاذ کرده بود، این بار به دنبال پیشیگرفتن از رقباست.
با این حال، این سوال مطرح است که این برتری تا چه زمانی ادامه خواهد داشت، زیرا OpenAI نیز ممکن است بهزودی مدل ترکیبی خود را عرضه کند و مدیرعامل این شرکت، سم آلتمن، اعلام کرده که این مدل در ماههای آینده ارائه خواهد شد.
دیدگاهتان را بنویسید