سامانه هوش مصنوعی ساختهشده توسط آزمایشگاه اصلی هوش مصنوعی گوگل (دیپ مایند)، موفق شده به سطح «مدال طلا» در المپیاد جهانی ریاضی دست یابد. این رقابت معتبر، هرساله برای دانشآموزان دبیرستانی برگزار میشود.
به گفته گوگل در پستی وبلاگی که دوشنبه منتشر شد، این نخستینبار است که یک ماشین چنین موفقیتی بهدست میآورد. هوش مصنوعی گوگل توانست در المپیاد جهانی ریاضی 2025 که در ماه جاری در استرالیا برگزار شد، پنج مسئله از شش مسئله را حل کند.
این خبر نشانهای دیگر از این است که شرکتهای پیشرو مانند گوگل همچنان در حال ارتقای سامانههای هوش مصنوعی خود در زمینههایی مانند ریاضی، علوم و برنامهنویسی کامپیوتر هستند. چنین فناوریهایی میتوانند روند پژوهش در حوزه ریاضیات و علوم را تسریع کرده و کار برنامهنویسان مجرب را سادهتر کنند.

دو روز پیش از آنکه گوگل از این موفقیت پرده بردارد، یکی از پژوهشگران شرکت OpenAI در یک پست شبکه اجتماعی اعلام کرد که این استارتاپ نیز فناوری جدیدی ساخته که موفق به کسب امتیازی مشابه در پرسشهای امسال شده، اگرچه بهطور رسمی در مسابقه شرکت نکرده است.
هر دو سامانه، چتباتهایی بودند که پرسشها را دریافت کرده و مشابه انسانها به آنها پاسخ میدادند. پیشتر نیز سامانههای هوش مصنوعی در المپیاد جهانی ریاضی یا IMO شرکت کرده بودند. البته آنها تنها زمانی قادر به پاسخگویی بودند که متخصصان انسانی، پرسشها را به زبان برنامهنویسی رایانهای ویژهای برای حل مسائل ریاضی ترجمه میکردند.
پایان وابستگی به ترجمه انسانی در حل ریاضیات
تانگ لوونگ، پژوهشگر ارشد در گوگل دیپ مایند، در مصاحبهای گفت: ما این مسائل را بهطور کامل با زبان طبیعی حل کردیم. یعنی هیچ مداخله انسانی وجود نداشت.
پس از آنکه شرکت OpenAI با معرفی ChatGPT در اواخر سال 2022 موج جدیدی از هوش مصنوعی را به راه انداخت، چتباتهای پیشرفته قادر شدند به پرسشها پاسخ دهند، شعر بگویند، مقالات خبری را خلاصه کنند و حتی کدهای سادهای بنویسند. اما در حل مسائل ریاضی اغلب با مشکل مواجه بودند.
در دو سال گذشته، شرکتهایی مانند گوگل و OpenAI سامانههایی ساختند که برای ریاضی مناسبتر بودند. آنها موفق شدند مسائل پیچیدهای که انسانهای عادی توان حل آنها را ندارند، حل کنند.
سال گذشته، گوگل دو سامانه به نامهای AlphaGeometry و AlphaProof را معرفی کرد که بهطور خاص برای ریاضی طراحی شده بودند. این سامانهها در رقابت IMO توانستند به سطح «مدال نقره» برسند و چهار مسئله از شش مسئله مسابقه را حل کنند. این نخستینبار بود که یک ماشین به مدال نقره دست مییافت. شرکتهای دیگر، از جمله استارتاپی به نام Harmonic، نیز سامانههای مشابهی ساختهاند.
با این حال، سامانههایی مانند AlphaProof و Harmonic چتبات نیستند. آنها تنها زمانی میتوانند به پرسشها پاسخ دهند که ریاضیدانها پرسشها را به زبان برنامهنویسی Lean ترجمه کرده باشند؛ زبانی که برای حل مسائل ریاضی طراحی شده است.
امسال، گوگل با چتباتی در مسابقات IMO شرکت کرد که توانایی خواندن و پاسخگویی به پرسشها به زبان انگلیسی را داشت. این سامانه هنوز دردسترس عموم قرار نگرفته است.
این فناوری که «Gemini Deep Think» نام دارد، در دستهبندی «سامانههای استدلالی» قرار میگیرد. چنین سامانههایی بهمنظور انجام وظایف پیچیده در حوزه ریاضی، علوم و برنامهنویسی طراحی شدهاند. برخلاف چتباتهای پیشین، این فناوری میتواند پیش از انتخاب پاسخ، برای حل مسائل پیچیده زمان صرف کرده و فرایند استدلال را طی کند.
شرکتهای دیگری مانند OpenAI، آنتروپیک و دیپسیک از چین نیز فناوریهای مشابهی ارائه دادهاند.
مانند سایر چتباتها، یک سامانه استدلالی در ابتدا با تحلیل حجم عظیمی از متون گردآوریشده از سطح اینترنت، مهارتهای اولیه خود را میآموزد. سپس در فرآیندی بهنام یادگیری تقویتی، از طریق آزمونوخطاهای فراوان، رفتارهای پیشرفتهتری را فرا میگیرد.
سامانههای استدلالی میتوانند بسیار پرهزینه باشند، زیرا برای پاسخگویی، زمان بیشتری صرف تفکر میکنند. گوگل اعلام کرده که سامانه Deep Think برای پاسخگویی به سوالات IMO به اندازه زمان اختصاصدادهشده به شرکتکنندگان انسانی، یعنی چهار ساعت و نیم، وقت صرف کرده است. با این حال، این شرکت از اعلام میزان هزینه، توان پردازشی یا برق مصرفشده برای انجام آزمون خودداری کرد.
در ماه دسامبر، سامانهای از OpenAI موفق شد عملکردی بهتر از انسانها در آزمون استدلالی پرطرفدار ARC-AGI ارائه دهد. اما به دلیل اینکه طبق برآوردهای قیمتی، هزینه برق و توان محاسباتی این آزمون به حدود 1.5 میلیون دلار رسید، شرکت مقررات رقابت را نقض کرد.
دیدگاهتان را بنویسید