OpenAI پس از بیش از پنج سال، اولین مدل های متن باز خود را معرفی کرد. این دو مدل زبانی با نامهای gpt-oss-120b و gpt-oss-20b معرفی شدهاند و قابلیت اجرا بهصورت محلی روی دستگاههای مصرفکننده را دارند و میتوان آنها را برای اهداف خاص آموزش مجدد داد.
این اقدام، نشاندهنده تغییری مهم در استراتژی اخیر OpenAI است؛ شرکتی که در سالهای گذشته عمدتاً روی مدلهای اختصاصی متمرکز شده بود. اکنون این شرکت در مسیر ارائه مجموعهای گستردهتر و بازتر از مدلهای هوش مصنوعی قرار گرفته که دردسترس کاربران قرار دارند. همچنین، براساس آنچه منابع آگاه ماه گذشته فاش کردند، شرکت OpenAI در آستانه عرضه مرورگر وبی مجهز به هوش مصنوعی است که انتظار میرود با مرورگر غالب بازار، یعنی گوگل کروم رقابت کند.
سم آلتمن، مدیرعامل OpenAI، در بیانیهای ایمیلی اعلام کرد: از اینکه این مدل را که حاصل میلیاردها دلار سرمایهگذاری تحقیقاتی است، دردسترس عموم قرار میدهیم تا هوش مصنوعی را به دست بیشترین تعداد ممکن از مردم برسانیم، بسیار خوشحالیم.

هر دو مدل gpt-oss-120b و gpt-oss-20b بهصورت رسمی و رایگان در پلتفرم Hugging Face، که یکی از میزبانهای محبوب ابزارهای هوش مصنوعی است، برای دانلود دردسترس قرار گرفتهاند. آخرین مدل متن بازمنتشرشده توسط OpenAI، GPT-2 بود که در سال 2019 عرضه شد.
تفاوت مدلهای متنباز با سایر مدلها
مدلهای متنباز از آن جهت متمایز هستند که «وزنها» یا همان پارامترهای داخلی آنها بهصورت عمومی منتشر میشود. این موضوع به پژوهشگران و توسعهدهندگان اجازه میدهد تا فرآیند پردازش اطلاعات مدل را بررسی کنند. گرگ بروکمن، یکی از بنیانگذاران OpenAI، این اقدام را نه بهعنوان تهدیدی برای مدلهای اختصاصی شرکت، بلکه مکملی برای سرویسهای پولی مانند API OpenAI میداند که بسیاری از توسعهدهندگان در حال حاضر از آن استفاده میکنند. او در نشستی خبری گفت: مدلهای متنباز نقاط قوت متفاوتی دارند.
برخلاف ChatGPT، این مدل های متن باز OpenAI میتوانند بدون اتصال اینترنتی و حتی در شرایط ایزوله اجرا شوند.

هر دو مدل gpt-oss از روش «استدلال زنجیرهای» (Chain-of-Thought Reasoning) استفاده میکنند. OpenAI برای اولینبار در مدل o1 که در پاییز گذشته معرفی شد، این روش را بهکار گرفت. در این روش، بهجای ارائه مستقیم پاسخ، مدل از چند مرحله فکری عبور میکند تا به نتیجه برسد. این مدلها فقط متنی هستند و هنوز قابلیت چندرسانهای ندارند، اما میتوانند در اینترنت جستجو کنند، از مدلهای ابری کمک بگیرند، کد اجرا کرده و بهعنوان یک عامل هوش مصنوعی نرمافزارها را هدایت کنند. مدل gpt-oss-20b، که نسخه کوچکتر محسوب میشود، به اندازهای جمعوجور است که بتوان آن را روی یک دستگاه مصرفی با بیش از 16 گیگابایت حافظه بهصورت محلی اجرا کرد.
این دو مدل جدید تحت مجوز Apache 2.0 منتشر شدهاند؛ مجوزی رایج برای مدلهای متنباز. تحت این مجوز، استفاده تجاری، بازتوزیع و ترکیب با نرمافزارهای دارای مجوز دیگر آزاد است. شرکتهایی مانند علیبابا (با مدلهای Qwen) و Mistral نیز مدلهای متنباز خود را تحت همین مجوز منتشر کردهاند.
با اینکه این مدلها رسماً در ماه مارچ معرفی شده بودند، انتشار آنها برای انجام تستهای ایمنی بیشتر به تعویق افتاد. انتشار یک مدل متنباز بهمراتب از یک مدل اختصاصی خطرناکتر است، چرا که محدودیتهایی که مانع سوءاستفاده میشوند را از میان برمیدارد و هر کسی میتواند نسخهای از gpt-oss را برای اهداف نادرست شخصیسازی کند.
اریک والاس، پژوهشگر حوزه ایمنی در OpenAI، گفت: ما مدل را بهصورت داخلی روی برخی حوزههای پرخطر بهطور خاص آموزش مجدد دادیم تا ببینیم در صورت سوءاستفاده تا چه اندازه میتوان خطر را افزایش داد.
او توضیح داد که مدل در تستهای OpenAI، طبق چارچوب ارزیابی آمادگی، سطح بالایی از ریسک را نشان نداد.
در خصوص عملکرد این مدل های متن باز جدید در مقایسه با دیگر مدلهای OpenAI، کریس کخ، یکی از پژوهشگران شرکت، در یک نشست خبری اظهار کرد: امتیازهای بنچمارک برای هر دو مدل بسیار قوی هستند.
او عملکرد gpt-oss-120b را با مدلهای اختصاصی o3 و o4-mini مقایسه کرد و گفت که حتی در برخی ارزیابیها عملکرد بهتری داشته است. کارت فنی مربوط به gpt-oss جزئیاتی از نحوه مقایسه این مدل با دیگر محصولات شرکت را شرح میدهد. در نشست خبری قبل از عرضه، تیم OpenAI همچنین به تأخیر پایین و هزینه کمتر اجرای این مدلها اشاره کرد.
در ابتدای سال جاری، استارتاپ چینی DeepSeek با انتشار یک مدل متنباز ارزانقیمت، توجه سیلیکونولی را جلب کرد. اگرچه در وبلاگ معرفی gpt-oss اشارهای مستقیم به دیپسیک یا دیگر شرکتهای چینی نشده، اما سم آلتمن بهوضوح اعلام کرده که ترجیح میدهد نوآوری در حوزه مدلهای متنباز در ایالات متحده صورت گیرد.
او گفت: از همان ابتدا در سال 2015، مأموریت OpenAI این بوده که هوش مصنوعی عمومی (AGI) را در جهت منافع تمام بشریت توسعه دهد. به همین منظور، ما از اینکه جهان بر پایه یک پلتفرم باز و آمریکایی با ارزشهای دموکراتیک، بهصورت رایگان و برای منفعت گسترده، توسعه پیدا کند، هیجانزده هستیم.
در آمریکا، شرکت متا تاکنون پیشتاز مدلهای متنباز بوده است. این شرکت در سال 2023 اولین نسخه از مدلهای سری Llama را منتشر کرد و چند ماه پیش هم Llama 4 را عرضه نمود. متا اکنون تمرکز زیادی بر توسعه هوش مصنوعی فراتر از توانایی شناختی انسان دارد؛ مفهومی که در دنیای هوش مصنوعی با عنوان «ابرهوش» شناخته میشود.
این شرکت اخیراً یک آزمایشگاه داخلی جدید با رهبری الکساندر وانگ، مدیرعامل سابق Scale، برای همین منظور راهاندازی کرده است. مارک زاکربرگ نیز اشاره کرده که ممکن است متا بهدلیل نگرانیهای ایمنی، در مدلهای آینده مسیر متنباز را ترک کند.
انتشار gpt-oss در زمانی صورت میگیرد که رقابت برای جذب استعدادهای هوش مصنوعی میان شرکتهایی مانند OpenAI و متا بهشدت افزایش یافته است. در سال 2025، پژوهشگران حوزه هوش مصنوعی با استعدادهای خاص، پیشنهادهای مالی بسیار بالایی برای تغییر شرکت دریافت میکنند. بسته به نحوه استقبال توسعهدهندگان از gpt-oss، این مدلها ممکن است رقیبی جدی برای متا محسوب شوند.
دیدگاهتان را بنویسید