بازگشت طوفانی OpenAI به دنیای مدل های متن باز؛ gpt-oss معرفی شد

توسط مهرانه راجعی ·15 مرداد 140415 مرداد 1404· 0

OpenAI پس از بیش از پنج سال، اولین مدل های متن باز خود را معرفی کرد. این دو مدل زبانی با نام‌های gpt-oss-120b و gpt-oss-20b معرفی شده‌اند و قابلیت اجرا به‌صورت محلی روی دستگاه‌های مصرف‌کننده را دارند و می‌توان آن‌ها را برای اهداف خاص آموزش مجدد داد.

این اقدام، نشان‌دهنده تغییری مهم در استراتژی اخیر OpenAI است؛ شرکتی که در سال‌های گذشته عمدتاً روی مدل‌های اختصاصی متمرکز شده بود. اکنون این شرکت در مسیر ارائه مجموعه‌ای گسترده‌تر و بازتر از مدل‌های هوش مصنوعی قرار گرفته که دردسترس کاربران قرار دارند. همچنین، براساس آنچه منابع آگاه ماه گذشته فاش کردند، شرکت OpenAI در آستانه عرضه مرورگر وبی مجهز به هوش مصنوعی است که انتظار می‌رود با مرورگر غالب بازار، یعنی گوگل کروم رقابت کند.

سم آلتمن، مدیرعامل OpenAI، در بیانیه‌ای ایمیلی اعلام کرد: از اینکه این مدل را که حاصل میلیاردها دلار سرمایه‌گذاری تحقیقاتی است، دردسترس عموم قرار می‌دهیم تا هوش مصنوعی را به دست بیشترین تعداد ممکن از مردم برسانیم، بسیار خوشحالیم.

بازگشت طوفانی OpenAI به دنیای مدل های متن باز؛ gpt-oss معرفی شد

هر دو مدل gpt-oss-120b و gpt-oss-20b به‌صورت رسمی و رایگان در پلتفرم Hugging Face، که یکی از میزبان‌های محبوب ابزارهای هوش مصنوعی است، برای دانلود دردسترس قرار گرفته‌اند. آخرین مدل متن بازمنتشرشده توسط OpenAI، GPT-2 بود که در سال 2019 عرضه شد.

تفاوت مدل‌های متن‌باز با سایر مدل‌ها

مدل‌های متن‌باز از آن جهت متمایز هستند که «وزن‌ها» یا همان پارامترهای داخلی آن‌ها به‌صورت عمومی منتشر می‌شود. این موضوع به پژوهشگران و توسعه‌دهندگان اجازه می‌دهد تا فرآیند پردازش اطلاعات مدل را بررسی کنند. گرگ بروکمن، یکی از بنیان‌گذاران OpenAI، این اقدام را نه به‌عنوان تهدیدی برای مدل‌های اختصاصی شرکت، بلکه مکملی برای سرویس‌های پولی مانند API OpenAI می‌داند که بسیاری از توسعه‌دهندگان در حال حاضر از آن استفاده می‌کنند. او در نشستی خبری گفت: مدل‌های متن‌باز نقاط قوت متفاوتی دارند.

برخلاف ChatGPT، این مدل های متن باز OpenAI می‌توانند بدون اتصال اینترنتی و حتی در شرایط ایزوله اجرا شوند.

هر دو مدل gpt-oss از روش «استدلال زنجیره‌ای» (Chain-of-Thought Reasoning) استفاده می‌کنند. OpenAI برای اولین‌بار در مدل o1 که در پاییز گذشته معرفی شد، این روش را به‌کار گرفت. در این روش، به‌جای ارائه مستقیم پاسخ، مدل از چند مرحله فکری عبور می‌کند تا به نتیجه برسد. این مدل‌ها فقط متنی هستند و هنوز قابلیت چندرسانه‌ای ندارند، اما می‌توانند در اینترنت جستجو کنند، از مدل‌های ابری کمک بگیرند، کد اجرا کرده و به‌عنوان یک عامل هوش مصنوعی نرم‌افزارها را هدایت کنند. مدل gpt-oss-20b، که نسخه کوچک‌تر محسوب می‌شود، به اندازه‌ای جمع‌وجور است که بتوان آن را روی یک دستگاه مصرفی با بیش از 16 گیگابایت حافظه به‌صورت محلی اجرا کرد.

این دو مدل جدید تحت مجوز Apache 2.0 منتشر شده‌اند؛ مجوزی رایج برای مدل‌های متن‌باز. تحت این مجوز، استفاده تجاری، بازتوزیع و ترکیب با نرم‌افزارهای دارای مجوز دیگر آزاد است. شرکت‌هایی مانند علی‌بابا (با مدل‌های Qwen) و Mistral نیز مدل‌های متن‌باز خود را تحت همین مجوز منتشر کرده‌اند.

با اینکه این مدل‌ها رسماً در ماه مارچ معرفی شده بودند، انتشار آن‌ها برای انجام تست‌های ایمنی بیشتر به تعویق افتاد. انتشار یک مدل متن‌باز به‌مراتب از یک مدل اختصاصی خطرناک‌تر است، چرا که محدودیت‌هایی که مانع سوءاستفاده می‌شوند را از میان برمی‌دارد و هر کسی می‌تواند نسخه‌ای از gpt-oss را برای اهداف نادرست شخصی‌سازی کند.

اریک والاس، پژوهشگر حوزه ایمنی در OpenAI، گفت: ما مدل را به‌صورت داخلی روی برخی حوزه‌های پرخطر به‌طور خاص آموزش مجدد دادیم تا ببینیم در صورت سوءاستفاده تا چه اندازه می‌توان خطر را افزایش داد.

او توضیح داد که مدل در تست‌های OpenAI، طبق چارچوب ارزیابی آمادگی، سطح بالایی از ریسک را نشان نداد.

در خصوص عملکرد این مدل های متن باز جدید در مقایسه با دیگر مدل‌های OpenAI، کریس کخ، یکی از پژوهشگران شرکت، در یک نشست خبری اظهار کرد: امتیازهای بنچمارک برای هر دو مدل بسیار قوی هستند.

او عملکرد gpt-oss-120b را با مدل‌های اختصاصی o3 و o4-mini مقایسه کرد و گفت که حتی در برخی ارزیابی‌ها عملکرد بهتری داشته است. کارت فنی مربوط به gpt-oss جزئیاتی از نحوه مقایسه این مدل با دیگر محصولات شرکت را شرح می‌دهد. در نشست خبری قبل از عرضه، تیم OpenAI همچنین به تأخیر پایین و هزینه کمتر اجرای این مدل‌ها اشاره کرد.

در ابتدای سال جاری، استارتاپ چینی DeepSeek با انتشار یک مدل متن‌باز ارزان‌قیمت، توجه سیلیکون‌ولی را جلب کرد. اگرچه در وبلاگ معرفی gpt-oss اشاره‌ای مستقیم به دیپ‌سیک یا دیگر شرکت‌های چینی نشده، اما سم آلتمن به‌وضوح اعلام کرده که ترجیح می‌دهد نوآوری در حوزه مدل‌های متن‌باز در ایالات متحده صورت گیرد.

او گفت: از همان ابتدا در سال 2015، مأموریت OpenAI این بوده که هوش مصنوعی عمومی (AGI) را در جهت منافع تمام بشریت توسعه دهد. به همین منظور، ما از اینکه جهان بر پایه یک پلتفرم باز و آمریکایی با ارزش‌های دموکراتیک، به‌صورت رایگان و برای منفعت گسترده، توسعه پیدا کند، هیجان‌زده هستیم.

در آمریکا، شرکت متا تاکنون پیشتاز مدل‌های متن‌باز بوده است. این شرکت در سال 2023 اولین نسخه از مدل‌های سری Llama را منتشر کرد و چند ماه پیش هم Llama 4 را عرضه نمود. متا اکنون تمرکز زیادی بر توسعه هوش مصنوعی فراتر از توانایی شناختی انسان دارد؛ مفهومی که در دنیای هوش مصنوعی با عنوان «ابرهوش» شناخته می‌شود.

این شرکت اخیراً یک آزمایشگاه داخلی جدید با رهبری الکساندر وانگ، مدیرعامل سابق Scale، برای همین منظور راه‌اندازی کرده است. مارک زاکربرگ نیز اشاره کرده که ممکن است متا به‌دلیل نگرانی‌های ایمنی، در مدل‌های آینده مسیر متن‌باز را ترک کند.

انتشار gpt-oss در زمانی صورت می‌گیرد که رقابت برای جذب استعدادهای هوش مصنوعی میان شرکت‌هایی مانند OpenAI و متا به‌شدت افزایش یافته است. در سال 2025، پژوهشگران حوزه هوش مصنوعی با استعدادهای خاص، پیشنهادهای مالی بسیار بالایی برای تغییر شرکت دریافت می‌کنند. بسته به نحوه استقبال توسعه‌دهندگان از gpt-oss، این مدل‌ها ممکن است رقیبی جدی برای متا محسوب شوند.

برچسب‌ها: چت بات

امتیاز: 5.0 از 5 (1 رای)

کمی صبر کنید...

دیدگاهتان را بنویسید لغو پاسخ

در صورتی که نظر شما حاوی ناسزا، عبارات توهین‌آمیز و تهدید بوده و در تضاد با قوانین فعلی کشور باشد از انتشار آن بدون حذف موارد ذکر شده، معذوریم.
شکلک‌ها (اموجی‌ها) را می‌توانید با کیبرد گوشی یا کیبرد مجازی ویندوز قرار دهید.
تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.