چند روز پیش، OpenAI مدل O3 را معرفی کرد و نشان داد که مدلهای هوش مصنوعی در حال پیشرفت به روشهای جدیدی هستند، اما هزینه ها نیز به همان اندازه افزایش یافتهاند.
ماه گذشته، بنیانگذاران و سرمایهگذاران حوزه هوش مصنوعی گفتند که اکنون در «دوران دوم قوانین مقیاسگذاری» هستیم و روشهای سنتی برای بهبود مدلهای هوش مصنوعی، نتایج کمتری به همراه دارند. یکی از روشهای جدید و امیدوارکنندهای که پیشنهاد کردند، مقیاسگذاری در زمان اجرا بود. به نظر میرسد این رویکرد عامل اصلی عملکرد قوی مدل O3 است، اما این روش نیز چالشهای خود را دارد.
پیشرفت در مقیاسگذاری با مدل O3
اعلام مدل O3 توسط اوپنایآی نشان داد که پیشرفت در مقیاسگذاری هوش مصنوعی هنوز متوقف نشده است. این مدل در آزمونهای استاندارد عملکرد خوبی داشت و در آزمون دشواری به نام ARC-AGI که توانایی عمومی را میسنجد، عملکردی بسیار بهتر از سایر مدلها ارائه کرد. همچنین در یک آزمون پیچیده ریاضی، مدل O3 موفق شد 25% امتیاز کسب کند، در حالی که هیچ مدل دیگری نتوانسته بود بیش از 2% امتیاز بگیرد.
با این حال، تا زمانی که نتواند O3 را خودش آزمایش کند، به این ادعاها با احتیاط نگاه میکند. با این وجود، حتی پیش از عرضه رسمی O3، بسیاری از متخصصان هوش مصنوعی بر این باور بودند که تحولی بزرگ درحال رخدادن است.
نوآم براون، یکی از سازندگان سری مدلهای O در اوپنایآی، اشاره کرد که این شرکت تنها سه ماه پس از معرفی مدل O1، مدل O3 را با دستاوردهای چشمگیر ارائه کرده است. او در توییتی گفت: ما دلایل کافی داریم که باور کنیم این روند ادامه خواهد داشت.
افقهای جدید در مقیاسگذاریجک کلارک، یکی از بنیانگذاران Anthropic، در یک پست وبلاگی نوشت که O3 نشاندهنده این است که پیشرفت هوش مصنوعی در سال 2025 سریعتر از 2024 خواهد بود. او پیشبینی کرد که سال آینده، صنعت هوش مصنوعی از ترکیب مقیاسگذاری سنتی و مقیاسگذاری در زمان اجرا برای بهبود مدلها استفاده خواهد کرد.
مقیاسگذاری در زمان اجرا چیست؟
مقیاسگذاری در زمان اجرا به این معناست که اوپنایآی در مرحله پاسخگویی (Inference) از قدرت پردازشی بیشتری استفاده میکند. این مرحله زمانی آغاز میشود که کاربر یک سؤال مطرح میکند و سیستم پاسخ میدهد. مشخص نیست دقیقاً اوپنایآی چه اقداماتی انجام داده، اما احتمالاً از چیپهای پردازشی بیشتر یا قدرتمندتر، یا برای مدت زمان طولانیتر (گاهی 10 تا 15 دقیقه) استفاده کرده است. این روش میتواند باعث بهبود عملکرد مدلها شود، اما هزینهها را نیز به طرز قابلتوجهی افزایش میدهد.
چالشهای هزینه و محدودیتها
یکی از بزرگترین محدودیتهای O3 هزینه بالای آن است. به گفته جک کلارک، دلیل اصلی بهبود عملکرد O3 استفاده بیشتر از منابع پردازشی است. او توضیح داد که این مدل با استفاده از محاسبات بیشتر، پاسخهای بهتری ارائه میدهد، اما هزینههای پیشبینیناپذیری به همراه دارد.
هزینه تولید هر پاسخ توسط مدل O3
برای مثال، مدل O3 در آزمون ARC-AGI که معیاری برای ارزیابی پیشرفت در زمینه هوش عمومی مصنوعی (AGI) است، موفق شد 88% امتیاز کسب کند. این در حالی است که مدل قبلی O1 تنها 32% امتیاز داشت. اما نسخهای از مدل O3 که این امتیاز بالا را به دست آورد، بیش از 1000 دلار هزینه پردازش برای هر وظیفه مصرف کرد، در حالی که O1 تنها 5 دلار هزینه داشت.
فرانسوا شوله، سازنده آزمون ARC-AGI، اشاره کرد که OpenAI از 170 برابر قدرت پردازشی بیشتر استفاده کرد تا به امتیاز 88% برسد. نسخهای از O3 که کارآمدتر بود، تنها 12% امتیاز کمتر کسب کرد، اما هزینه پردازش آن بیش از 10,000 دلار بود. بنابراین، این نسخه نمیتواند در رقابت ARC جایزهای کسب کند.کاربردهای محدود برای کاربران خاصO3 به دلیل هزینههای بالا نمیتواند در استفاده روزمره به کار رود. به عنوان مثال، این مدل برای پاسخ به سؤالات کوچک و روزمره مانند «آیا تیم کلیولند براونز هنوز میتواند به پلیآف 2024 برسد؟» مناسب نیست.
اما برای سؤالات مهمتر و استراتژیک مانند «چگونه کلیولند براونز میتواند تا سال 2027 به قهرمانی سوپربول برسد؟» ممکن است ارزش هزینه را داشته باشد، بهخصوص اگر کاربری مانند مدیرکل تیم به دنبال تصمیمگیریهای بزرگ باشد.
ایتن مولیک، استاد دانشگاه وارتون، در توییتی اشاره کرد که مدل O3 برای کارهای دانشگاهی، مالی، و مسائل صنعتی میتواند توجیه اقتصادی داشته باشد، حتی اگر پاسخها صدها یا هزاران دلار هزینه داشته باشد.
پیشرفتهای آینده و چالشهای باقیمانده
اگرچه O3 گام بزرگی در بهبود عملکرد مدلهای هوش مصنوعی محسوب میشود، اما هنوز مشکلاتی مانند هزینه بالا و عدم دقت در برخی وظایف ساده را دارد. علاوه بر این، مشکل توهم (Hallucination) در مدلهای زبانی بزرگ همچنان حل نشده است، و این موضوع باعث میشود کاربران نتوانند کاملاً به پاسخها اعتماد کنند.یکی از راههای بهبود این مشکل، توسعه چیپهای پردازشی بهتر برای زمان اجرا است. استارتاپهایی مانند Groq و Cerebras در حال طراحی چیپهای پیشرفتهتر هستند که میتوانند هزینههای پردازش را کاهش دهند.
مدل O3 نشاندهنده پیشرفت قابلتوجهی در زمینه هوش مصنوعی است و بر اهمیت مقیاسگذاری در زمان اجرا تأکید دارد. با این حال، هزینههای بالای آن سؤالات جدیدی درباره کاربردهای عملی و محدودیتهای اقتصادی ایجاد میکند. اگرچه O3 بهعنوان یک مدل همهمنظوره مناسب نیست، اما میتواند در حوزههایی که هزینه پردازش مشکلی ایجاد نمیکند، کاربردهای مهمی داشته باشد.
برا هر جواب 1000 دلار ؟؟؟
خب بدن به من