در دنیای امروز، شرکتهای هوش مصنوعی مانند OpenAI و گوگل همواره به دنبال راههای تازهای برای رقابتدادن مدلهای خود با یکدیگر هستند. یکی از تازهترین تلاشها برای سنجش توانایی مدلهای برتر، برگزاری یک مسابقه شطرنج بین هشت مدل زبانی بزرگ بود. نتیجه این رقابت، پیروزی کامل مدل o3 از OpenAI بود که حتی در فینال مسابقه شطرنج موفق شد گروک 4 را نیز شکست دهد.
هشت مدل زبانی بزرگ از آنتروپیک، گوگل، OpenAI، xAI و همچنین توسعهدهندگان چینی دیپسیک و Moonshot AI، در طول مسابقات سه روزه Kaggle با یکدیگر به رقابت پرداختند.
o3 در مواجهه با Grok 4 از xAI که در مرحله گروهی عملکرد خوبی داشت و قدرت برتر را با میانگین دقت حرکت 90.8٪، در مقایسه با 80.2٪ گروک 4 نشان داد.
در هر چهار بازی، ChatGPT پس از 35، 30، 28 و 54 حرکت حریف خود را کیش و مات کرد. هیکارو ناکامورا، نفر دوم جهان، گفت که گروک 4 در این مسابقه عصبی و مضطرب به نظر میرسید و اغلب مهرهها را به راحتی از دست میداد؛ اتفاقی که به ندرت در پیروزیها مقابل Gemini 2.5 Flash و Gemini 2.5 Pro از گوگل رخ داد.
o3 این مسابقات را با سه برد با نتیجه 4-0 به پایان رساند؛ با میانگین نرخ دقت 12 بازی بالای 91٪. اگرچه قدرت آن با قدرت یک استاد بزرگ قابل مقایسه نیست، بازیکنانی که رتبه شطرنج آنلاین آنها 2000 یا کمتر است، ممکن است در مواجهه با o3، به خصوص در بازیهای بلیتس یا سوپر بلیتس، با مشکل مواجه شوند.
بسیاری از رسانهها، از جمله BBC، موفقیت OpenAI را گزارش کردهاند، اما این پرسش پیش میآید که اصلاً چرا باید چنین موضوعی اهمیت داشته باشد؟
دلیل این تردید آن است که شرکتهای کامپیوتری سالهاست از شطرنج بهعنوان معیاری برای ارزیابی توانایی و پیشرفت مدلهای یادگیری ماشین استفاده میکنند. این روند آنقدر تکرار شده که اغلب ماشینهای شطرنج مدرن در برابر انسانها شکستناپذیر هستند. با این حال، شطرنج زندگی واقعی نیست.
با توجه به حجم زیاد مطالب در شبکههای خبری درباره پیشرفت هوش مصنوعی، شاید عجیب به نظر برسد که شکست گروک در برابر OpenAI در شطرنج چندان مهم شمرده نشود. با این حال، حتی اگر واکنش ایلان ماسک به این نتیجه را رفتاری متکبرانه قلمداد کنیم، باید گفت نظر او مبنی بر این که موفقیت گروک در شطرنج تنها یک پیامد جانبی است، کاملاً درست به نظر میرسد.
مهارت در شطرنج هدف اصلی هوش مصنوعی نیست
شرکتهایی مانند OpenAI، جمینای و آنتروپیک که هر چند ماه یک مدل تازه ارائه میکنند، هدفشان ساخت هوش مصنوعی برای بازی شطرنج نیست. آنها این فناوری را برای خودکارسازی کارهای روزمره انسانها در شغل و زندگی ساختهاند. برخی حتی هوش مصنوعی را جایگزینی برای کار انسانی میدانند. بنابراین، عملکرد چند مدل در شطرنج تأثیر چندانی بر درک عمومی از این فناوری نخواهد داشت.

مدل o3 از OpenAI شاید بتواند بهتر از هر انسان دیگری شطرنج بازی کند، اما قادر به نوشتن یک رمان بزرگ آمریکایی نیست؛ صرفنظر از آنچه سم آلتمن میگوید. حتی با عرضه مدلهای پیشرفتهتر مانند GPT-5، همچنان فقدان حس انسانی و عاطفه در این فعالیتها محسوس است. علاوه بر این، مشکلاتی مانند خطاهای توهمی هوش مصنوعی و تأثیر منفی چتباتها بر سلامت روان کاربران، چالشهایی هستند که در شطرنج وجود ندارند.
در نهایت، عملکرد GPT، جمینای، گروک یا هر مدل دیگری در چند بازی شطرنج، هیچ تأثیر واقعی بر اهداف بلندمدت شرکتهای هوش مصنوعی ندارد. این پیروزیها شاید تیترهای جذابی بسازند، اما پاسخگوی پرسشهای اساسی در مورد این فناوری نیستند؛ پرسشهایی مانند این که هوش مصنوعی چه میزان خطر برای بشر دارد و چه شغلهایی را جایگزین خواهد کرد.
ناگفته نماند که چند ماه پیش، یک شبیهسازی دقیق و کامل از پردازنده آتاری 2600 که با سرعت ناچیز 1.19 مگاهرتز اجرا میشود، بهراحتی موفق شد ChatGPT را در بازی شطرنج کاملاً تحقیر کند. اما آیا آتاری 2600 از ChatGPT باهوشتر است؟
دیدگاهتان را بنویسید