xAI اعلام کرده که گروک 4.1 (Grok 4.1) یک بهروزرسانی قابلتوجه است؛ بهروزرسانی که فقط درباره سریعتر یا دقیقترشدن نیست. این مدل تازه، توانایی بسیار بیشتری در تشخیص لحن، واکنش به احساسات و ارائه پاسخهایی دارد که شبیه فردی است که طرف دیگر صفحه حضور دارد و کاربر را درک میکند. همچنین به نظر میرسد این نسخه کمی شوخطبع و بازیگوش نیز شده است.
عملکرد گروک 4.1
تنها چند ساعت پس از منتشرشدن، گروک 4.1 توانست به صدر دو جدول رتبهبندی مهم هوش مصنوعی برسد. در جدول LMArena Text Leaderboard امتیاز اولیه 1483 را ثبت کرد که آن را بالاتر از تمام مدلهایی قرار میدهد که کاربران در حال حاضر میتوانند بهصورت عمومی با آنها گفتگو کنند. علاوه بر این، در رتبه نخست EQ-Bench3 نیز قرار گرفت؛ معیاری که بهطور ویژه برای سنجش هوش هیجانی طراحی شده و توسط Claude Sonnet 3.7 ارزیابی میشود.
بزرگترین ارتقاهای این نسخه، در دو حوزه اصلی دیده میشود: درک هیجانی و بهبود کیفیت نوشتن. مکالمهها نسبت به نسخههای قبل طبیعیتر شدهاند؛ پاسخها اکنون همراه با نشانههای کوچکی از همدلی یا شوخی ارائه میشوند و دیگر این حس را منتقل نمیکنند که نویسنده آنها یک چتبات معمولی است. وقتی از آن بخواهند برای یک سفر به سانفرانسیسکو پیشنهاد بدهد یا یک پست تند و سریع برای X بنویسد، نتیجه بیشتر شبیه حرفهای یک دوست باهوش و اهل ذوق به نظر میرسد تا خروجی یک نرمافزار. xAI گفته این تغییرات با کمک گرفتن از «مربیان خبره هوش مصنوعی» برای اصلاح لحن و سبک نوشتار مدل ایجاد شده است.

البته این بهروزرسانی فقط نقاط مثبت ندارد. در کارت مدل Grok 4.1 اشاره شده که نرخ رفتارهای نادرست یا فریبنده در آن نسبت به نسخه قبلی اندکی افزایش یافته است. همچنین این نسخه در حالت Thinking تمایل بیشتری دارد که وارد حوزههای حساس یا بحثبرانگیز شود و از طرف دیگر، در API کمی راحتتر میتوان آن را با حملات prompt-injection دور زد. هیچیک از این مشکلات کاملاً غیرمنتظره نیستند؛ زیرا xAI نسخه 4.1 را مدلی «بیفیلترتر و بیانگرتر» توصیف کرده است. با این حال، این نگرانیها همچنان قابل توجهاند.
بهروزرسانی جدید همین حالا در همه جا فعال است. هر کاربری که گروک را در وب یا از طریق اپلیکیشنهای X استفاده میکند، میتواند از قسمت انتخاب مدل، نسخه گروک 4.1 را فعال کرده و خودش آن را تجربه کند. اکنون این مدل در رتبه اول جدولهای عمومی قرار دارد و با توجه به بازخوردهای اولیه، مشخص است که هدفش فقط «باهوشبودن» نیست؛ بلکه میخواهد دقیقاً آنجایی باشد که کاربر قرار دارد و او را به شکلی انسانیتر همراهی کند.








دیدگاهتان را بنویسید