شرکت OpenAI روز پنجشنبه و در شرایطی که رقابتی تنگاتنگ با گوگل را تجربه میکرد، مدل جدید GPT-5.2 را معرفی کرد که بهعنوان پیشرفتهترین نسخه این شرکت و برای استفاده توسعهدهندگان و متخصصان در کارهای روزمره طراحی شده است. این معرفی در زمانی صورت گرفت که گزارشهایی درباره صدور یادداشت داخلی «کد قرمز» منتشر شده و فشار برای بازپسگیری سهم کاربران بالا رفته بود.
این نسخه قرار است برای کاربران پولی ChatGPT و توسعهدهندگان API در سه مدل ارائه شود: نسخه Instant که برای پرسوجوهای سریع و فعالیتهایی مانند جستوجوی اطلاعات، نگارش متن و ترجمه طراحی شده؛ نسخه Thinking که برای کارهای پیچیده مثل برنامهنویسی، تحلیل اسناد حجیم، ریاضیات و برنامهریزی بهینه شده و نسخه Pro که دقیقترین عملکرد را برای مسائل دشوار ارائه میکند.
Fidji Simo (فیدیجی سیمو)، مدیر ارشد محصول، در جلسه روز پنجشنبه توضیح داد که GPT-5.2 با هدف افزایش ارزش اقتصادی برای کاربران توسعه یافته و اکنون توانایی بیشتری در ساخت فایلهای محاسباتی، تولید ارائهها، نوشتن کد، درک تصاویر، فهم متنهای طولانی و پیشبرد پروژههای چندمرحلهای دارد.
رقیبی تازهنفس برای جمینای 3
این مدل در زمانی عرضه شده که کوگل با جمینای 3 در اغلب بنچمارکها صدرنشینی میکند و تنها حوزهای که گوگل در آن جایگاه نخست ندارد، کدنویسی است؛ جایی که Claude Opus-4.5 از آنتروپیک همچنان برتری خود را حفظ کرده است. در اوایل همین ماه، گزارش شد که سم آلتمن بهدلیل کاهش ترافیک ChatGPT و نگرانی از کاهش سهم بازار در برابر گوگل، یادداشت «کد قرمز» را منتشر کرده و خواستار تغییر فوری برخی اولویتها شده بود؛ از جمله کنارگذاشتن برنامههای تبلیغاتی و تمرکز بر بهبود تجربه کاربری.
GPT-5.2 تلاشی مستقیم برای بازگرداندن پیشتازی OpenAI محسوب میشود، حتی با وجود اینکه برخی کارکنان پیشنهاد داده بودند انتشار آن به تأخیر بیفتد تا زمان بیشتری برای بهبود مدل وجود داشته باشد. اگرچه تصور میشد تمرکز شرکت بر توسعه امکانات شخصیسازی برای کاربران عادی باشد، عرضه این مدل نشان میدهد که OpenAI اکنون تلاش میکند حضور خود را در بازار سازمانی و میان توسعهدهندگان تقویت کند. دادههای منتشرشده در همین هفته نیز نشان داد که استفاده سازمانها از ابزارهای این شرکت طی یک سال گذشته رشد قابلتوجهی داشته است.
در همین حال، گوگل تلاش کرده Gemini 3 را بهطور عمیق در اکوسیستم محصولات و سرویسهای ابری خود ادغام کند. این شرکت در هفته جاری سرورهای مدیریتشده MCP را معرفی کرد که اتصال عاملها به سرویسهایی مانند Maps و BigQuery را آسانتر میکند. MCP درواقع رابط اصلی میان هوش مصنوعی، دادهها و ابزارهای بیرونی است.

OpenAI اعلام کرده که GPT-5.2 در حوزههایی مانند برنامهنویسی، ریاضیات، علوم، پردازش دیداری، استدلال در متنهای طولانی و استفاده از ابزارها، نتایج بهتری نسبت به نسخههای قبلی و برخی رقبا کسب کرده است. این پیشرفتها میتواند به گردشکارهای عاملمحور قابلاعتمادتر، تولید کد مناسب برای محیطهای واقعی و ساخت سیستمهای پیچیده در زمینههای حجیم و دادههای واقعی منجر شود.
این تواناییها GPT-5.2 را مقابل حالت Deep Think در Gemini 3 قرار میدهد؛ حالتی که بهعنوان جهشی مهم در استدلال منطقی، ریاضی و علمی توصیف شده است. بنچمارکهای داخلی OpenAI نشان میدهد نسخه Thinking در GPT-5.2 در تمامی آزمونهای استدلال، از جمله SWE-Bench Pro برای مهندسی نرمافزار، GPQA Diamond برای دانش علمی سطح دکتری و مجموعههای ARC-AGI برای کشف الگو، عملکرد بهتری نسبت به Gemini 3 و Claude Opus 4.5 ارائه میدهد.
Aidan Clark (آیدان کلارک)، سرپرست تحقیق، توضیح داد که امتیاز بالای مدل در ریاضیات تنها به معنای حل معادله نیست. او گفت استدلال ریاضی راهی برای سنجش توانایی مدل در دنبالکردن منطق چندمرحلهای، حفظ سازگاری اعداد و جلوگیری از خطاهای کوچک اما تأثیرگذار است؛ ویژگیهایی که در کارهایی مانند مدلسازی مالی، پیشبینی و تحلیل داده نقش مهمی دارند.
در ادامه، Max Schwarzer (مکس شوارتزر)، مدیر محصول، اعلام کرد که GPT-5.2 در تولید و رفع اشکال کد پیشرفت چشمگیری داشته و توانایی بیشتری در توضیح گامبهگام مسائل پیچیده ریاضی و منطقی دارد. به گفته او، استارتاپهایی مانند Windsurf و CharlieCode گزارش دادهاند که این مدل توانسته عملکردی همسطح بهترین عاملهای کدنویسی ارائه دهد و در گردشکارهای چندمرحلهای بهبود قابلاندازهگیری ایجاد کند. او همچنین اشاره کرد که نسخه Thinking در این مدل نسبت به نسخه قبلی 38 درصد خطای کمتر دارد و این موضوع باعث افزایش اعتمادپذیری آن در تصمیمگیری، پژوهش و نگارش روزمره شده است.
GPT-5.2 مسیر مدلهای پیشین را ادامه میدهد
GPT-5.2 در اصل ادامهای بر مسیر دو نسخه قبلی است. GPT-5 که در آگوست 2025 عرضه شد، ساختاری تازه معرفی کرد که امکان جابهجایی بین حالت سریع و حالت Thinking را فراهم میکرد. GPT-5.1 نیز که در نوامبر منتشر شد، این سیستم را طبیعیتر و مناسبتر برای کارهای عاملمحور و برنامهنویسی کرد. نسخه جدید، مجموعه این پیشرفتها را تقویت کرده و مدل را برای استفاده تولیدی پایدارتر ساخته است.
در این مرحله، فشار بر OpenAI بیش از همیشه است. این شرکت تعهداتی به ارزش 1.4 تریلیون دلار برای ساخت زیرساختهای هوش مصنوعی طی سالهای آینده ثبت کرده؛ تعهداتی که زمانی شکل گرفت که شرکت هنوز برتری آغازین خود را در بازار حفظ کرده بود. اکنون که گوگل با سرعت بیشتری پیش میرود، همین تعهدات احتمالاً عامل اصلی هشدار «کد قرمز» آلتمن بوده است.
تمرکز بیشتر بر مدلهای استدلالی نیز با ریسک همراه است. حالتهایی مانند Thinking و Deep Research نسبت به چتباتهای معمولی نیازمند محاسبات بیشتری هستند و هزینه اجرای آنها بالاتر است. اتکا به چنین مدلهایی در GPT-5.2 ممکن است چرخهای هزینهزا ایجاد کند: افزایش مخارج برای کسب رتبههای بهتر و سپس افزایش بیشتر هزینه برای اجرای مدلهای پرمصرف در مقیاس بالا.
گزارشها نشان میدهد هزینههای محاسباتی OpenAI بیش از چیزی است که قبلاً بیان شده بود. طبق گزارشها، بخش زیادی از هزینه استنتاج بهجای اعتبارهای ابری، بهصورت نقد پرداخته میشود که نشان میدهد هزینهها از سطح مشارکتها و اعتبارهای رایگان فراتر رفته است. با این حال، سیمو توضیح داد که با افزایش مقیاس فعالیت شرکت، امکان ارائه محصولات بیشتر و ایجاد درآمد جدید برای پوشش هزینههای بالاتر فراهم میشود. او بیان کرد که کاربران امروز به نسبت سال گذشته با همان مقدار هزینه، هوش بسیار بیشتری دریافت میکنند.
با وجود تمرکز زیاد بر استدلال، نکتهای که در معرفی این مدل وجود نداشت، رونمایی از یک مولد تصویر جدید بود. گفته شده آلتمن در یادداشت کد قرمز اعلام کرده بود که توسعه سیستم تصویر باید در اولویت باشد، خصوصاً پس از اینکه مدل Gemini 2.5 Flash Image یا همان Nano Banana در آگوست 2025 بهسرعت وایرال شد. ماه گذشته نیز گوگل نسخه Nano Banana Pro یا Gemini 3 Pro Image را معرفی کرد که توانایی بالاتری در رندر متن، دانش دنیای واقعی و تولید تصاویر نزدیک به واقعیت دارد و بهخوبی در محصولات گوگل ادغام شده است؛ از جمله در ابزار Mixboard برای ساخت خودکار ارائهها.
گزارشها اشاره کردهاند که OpenAI احتمالاً در ژانویه 2026 نسخهای با کیفیت تصویری بهتر، سرعت بیشتر و شخصیت بهبودیافته معرفی خواهد کرد، هرچند شرکت در مراسم اخیر این خبر را تأیید نکرد. این شرکت همچنین اعلام کرد که اقداماتی در حوزه ایمنی، شامل نظارت بر استفاده مرتبط با سلامت روان و بررسی سن کاربران نوجوان، در راه است؛ هرچند توضیح زیادی درباره این تغییرات ارائه نشد.








دیدگاهتان را بنویسید