موضوعات داغ
  • بتلفیلد 6
  • گوشی‌های سری گلکسی S26
  • آیفون 17 اپل
  • بازی GTA VI
  • گلکسی S25 FE
  • دینو
سخت افزار مگ
  • اخبار و مقالات
    • گوشی موبایل
      • لوازم جانبی موبایل
    • تبلت
    • لپ تاپ
    • دسکتاپ
      • مادربرد
      • پردازنده مرکزی
      • کارت گرافیک
      • تجهیزات ذخیره سازی
      • حافظه
      • صفحه نمایش
      • تجهیزات جانبی
    • تصویرگری دیجیتال
    • صوتی و تصویری
    • شبکه
    • نرم افزار و بازی
    • کالبدشکافی قطعات
    • مطالب گوناگون
  • بررسی
    • بررسی گوشی موبایل
    • بررسی تبلت
    • بررسی لپ تاپ
    • دسکتاپ
      • بررسی کولر و فن
      • بررسی مادربرد
      • بررسی کارت گرافیک
      • بررسی تجهیزات ذخیره سازی
      • بررسی حافظه
      • بررسی منبع تغذیه و کیس
      • بررسی تجهیزات جانبی
      • بررسی صفحه نمایش
    • بررسی تصویرگری دیجیتال
    • بررسی صوتی و تصویری
    • بررسی شبکه
    • بررسی نرم افزار و بازی
    • بررسی گوناگون
  • راهنمای خرید
    • سیستم پیشنهادی
  • لیست قیمت
    • گوشی موبایل
      • لیست قیمت روز گوشی‌های سامسونگ
      • لیست قیمت روز گوشی‌های شیائومی
      • لیست قیمت روز گوشی‌های هواوی
      • لیست قیمت روز گوشی های آنر
    • تبلت
    • لپ‌تاپ
    • قطعات کامپیوتر
      • لیست قیمت پردازنده
    • محصولات اپل
    • تجهیزات شبکه
    • لوازم خانگی
    • صوتی و تصویری
    • دوربین دیجیتال
    • تجهیزات بازی
    • خودرو
  • ویژه
    • مسابقات
    • نمایشگاه
تبلیغات
تبلیغات
تبلیغات

اخبار و مقالات / مطالب گوناگون

چرا هوش مصنوعی نمی‌تواند از پس سوالات تاریخی بربیاید؟

Avatarتوسط مهرانه راجعی ·2 بهمن 14032 بهمن 1403· 0

هوش مصنوعی ممکن است در برخی وظایف مانند کدنویسی یا تولید پادکست عملکرد فوق‌العاده‌ای داشته باشد، اما طبق نتایج یک مقاله جدید، در آزمون پیشرفته تاریخ چندان موفق نیست.

گروهی از پژوهشگران یک معیار جدید به نام Hist-LLM طراحی کرده‌اند تا عملکرد سه مدل زبانی بزرگ برتر (LLM) را روی سوالات تاریخی آزمایش کنند: GPT-4 از OpenAI، Llama از متا، و جمینای از گوگل. معیار Hist-LLM، صحت پاسخ‌ها را بر اساس بانک اطلاعات تاریخ جهانی Seshat، پایگاه داده وسیعی از دانش تاریخی به نام الهه خرد مصر باستان، آزمایش می‌کند.

طبق گفته پژوهشگران وابسته به موسسه تحقیقاتی Complexity Science Hub (CSH) در اتریش، نتایجی که ماه گذشته در کنفرانس برجسته هوش مصنوعی NeurIPS ارائه شد، ناامیدکننده بود. بهترین عملکرد متعلق به GPT-4 Turbo بود که تنها حدود 46 درصد دقت داشت، یعنی کمی بیشتر از حدس‌زدن تصادفی.

نکته اصلی مطالعه این است که LLMها در عین درخشش، هنوز فاقد عمق درک لازم برای تاریخچه پیشرفته هستند. ماریا دل ریو-چانونا، یکی از نویسندگان مقاله و استادیار علوم کامپیوتر در دانشگاه کالج لندن گفت: این مدل‌ها در ارائه حقایق ساده عالی‌اند، اما وقتی صحبت از سوالات پیچیده و پیشرفته تاریخی در سطح دکتری می‌شود، هنوز به این سطح نرسیده‌اند.

پژوهشگران نمونه‌هایی از سوالات تاریخی را که مدل‌های زبانی نتوانستند به درستی پاسخ دهند، با وبسایت TechCrunch به اشتراک گذاشتند. برای مثال، از GPT-4 Turbo پرسیده شد که آیا زره فلس‌دار (scale armor) در دوره‌ای خاص در مصر باستان وجود داشته است یا خیر. این مدل پاسخ مثبت داد، در حالی که این فناوری 1500 سال بعد در مصر ظاهر شد.

چرا مدل‌های هوش مصنوعی در پاسخ‌دهی به سوالات تاریخی پیشرفته ضعیف هستند؟

همانطور که می‌بینید، مدل‌های هوش مصنوعی می‌توانند به سوالات بسیار پیچیده درباره موضوعاتی مانند کدنویسی پاسخ دهند، اما در تاریخ ضعیف عمل می‌کنند. حالا چرا؟ در این زمینه، دل ریو-چانونا معتقد است این مدل‌های زبانی از داده‌های تاریخی برجسته و رایج استفاده می‌کنند و در بازیابی اطلاعات تاریخی کمترشناخته‌شده دچار مشکل می‌شوند.

چرا هوش مصنوعی نمی‌تواند از پس سوالات تاریخی بربیاید؟

برای مثال، پژوهشگران از GPT-4 پرسیدند که آیا مصر باستان در یک دوره خاص تاریخی، ارتش دائمی حرفه‌ای داشته است یا خیر. پاسخ درست «خیر» است، اما مدل زبانی به اشتباه پاسخ مثبت داد. دلیل آن هم این است که اطلاعات عمومی زیادی درباره سایر امپراتوری‌های باستانی مانند ایران، که ارتش دائمی داشتند، وجود دارد.

دل ریو-چانونا توضیح داد: اگر A و B را 100 بار بشنوید و C را تنها یک بار و سپس سوالی درباره C از شما پرسیده شود، ممکن است فقط A و B را به یاد بیاورید و سعی کنید از آن‌ها نتیجه‌گیری کنید.

پژوهشگران همچنین به حقایق دیگری از جمله اینکه مدل‌های OpenAI و Llama در مورد برخی مناطق مانند آفریقای جنوب صحرای بزرگ عملکرد بدتری داشتند، پی بردند. این امز احتمالاً نشان‌دهنده سوگیری در داده‌های آموزشی آن‌ها است.

پیتر تورچین، که رهبری این مطالعه را بر عهده داشت و یکی از اعضای هیئت علمی CSH است، گفت که این نتایج نشان می‌دهد مدل‌های زبانی بزرگ هنوز هم در برخی حوزه‌ها جایگزین انسان‌ها نیستند.

با این حال، پژوهشگران امیدوارند که مدل‌های زبانی بتوانند در آینده به مورخان کمک کنند. آن‌ها با اضافه‌کردن داده‌های بیشتر از مناطق کمترنمایان‌شده و طراحی سوالات پیچیده‌تر، در حال کار بر روی بهبود این مورد هستند.

  • چرا زبان مدل جدید هوش مصنوعی OpenAI وسط پاسخ به فارسی تغییر می‌کند؟
  • معرفی کامل Runway AI: هوش مصنوعی ساخت ویدیو
  • بیانیه رسمی NVIDIA درباره قانون اشتباه «انتشار هوش مصنوعی» دولت بایدن

برچسب‌ها: هوش مصنوعی

امتیاز: 5.0 از 5 (1 رای)
کمی صبر کنید...
تبلیغات
تبلیغات
سرخط خبرها:
  1. تکلیف مبالغ دریافتی برای سرویس اینترنت پرو مشخص شد
  2. قیمت GTA 6 لو رفت؛ نسخه استاندارد 90 یورو قیمت‌گذاری شده است!
  3. احتمال استفاده از نمایشگر BOE در گلکسی S27؛ تغییری جنجالی در پرچمدار سامسونگ
  4. بازگشت نسبی تحرک به بازار کار ایران پس از اتصال مجدد اینترنت
  5. مدیرعامل مخابرات: شهرداری تهران مانع ارتقای توسعه فیبر نوری است

مطالب مرتبط ...

  • 0

    قابلیت تشخیص و طبقه بندی تصاویر به کمک یادگیری عمیق در فیسبوک و اینستاگرام

    Avatarتوسط امیرحسین آریایی · 13 اردیبهشت 1397 · 11 خرداد 1399

  • 0

    نیم‌میلیون دانلود در یک روز؛ نسخه اندروید Sora دنیا را تسخیر کرد!

    Avatarتوسط مهرانه راجعی · 16 آبان 1404 · 16 آبان 1404

  • 0

    OpenAI موتور جستجوی مبتنی‌بر هوش مصنوعی SearchGPT را معرفی کرد

    Avatarتوسط مهرانه راجعی · 6 مرداد 1403 · 6 مرداد 1403

مطالب گوناگون از دینو

کدام داروها می‌توانند تحمل گرما را سخت‌تر کنند؟

10 فیلم فوق‌ العاده که به شما کمک می کند بچه ها را بهتر درک کنید

چگونه از نشخوار افکار منفی و تجربیات گذشته خودداری کنیم؟

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

در صورتی که نظر شما حاوی ناسزا، عبارات توهین‌آمیز و تهدید بوده و در تضاد با قوانین فعلی کشور باشد از انتشار آن بدون حذف موارد ذکر شده، معذوریم.
شکلک‌ها (اموجی‌ها) را می‌توانید با کیبرد گوشی یا کیبرد مجازی ویندوز قرار دهید.
تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.

پربحث‌ترین‌ها

  • ماجرای شکایت کاربران از فروشگاه «پی سی کالا» (PCKala) 7

    متن بیانیه پی سی کالا؛ در میان طوفان بحران، هنوز به عهد خود با مشتریان پایبندیم

  • لیست دستگاه‌ های سامسونگ که به‌روزرسانی One UI 9 را دریافت می‌کنند 6

    لیست دستگاه‌ های سامسونگ که به‌روزرسانی One UI 9 را دریافت می‌کنند

  • مقابله با پیامک‌های تبلیغاتی اپراتورها 2

    جریمه‌های سنگین در انتظار اپراتورها؛ خط و نشان وزارت ارتباطات برای پیامک‌های تبلیغاتی

  • ترامپ: اپل برای تولید تراشه در آمریکا با اینتل همکاری خواهد کرد 1

    ترامپ: اپل برای تولید تراشه در آمریکا با اینتل همکاری خواهد کرد

آخرین بررسی‌ها

9.7

بررسی حافظه اس‌اس‌دی SAMSUNG 9100 PRO 2TB

9.3

بررسی مادربرد X870 AORUS STEALTH ICE گیگابایت

8.8

تماشا کنید: بررسی گوشی گلکسی A17 4G سامسونگ؛ اقتصادی تازه‌نفس

8.8

بررسی لپ تاپ MSI Vector 16 HX - اژدهای همه‌فن‌حریف

9.6

تماشا کنید: بررسی Aorus FO27Q3 گیگابایت | بهترین مانیتور گیمینگ 2025؟

آخرین مطالب دینو

انقلاب‌های جهان: مهم‌ترین انقلاب‌های تاریخ که تاثیرات مهمی بر جهان داشتند!

کتاب‌های درسی تاریخ پر از صفحاتی است که انقلاب‌های…

  • حقایقی درباره پنتاگون که ممکن است شما را شگفت‌زده کند

  • 0 تا 100 اجرای روف گاردن در تهران | از طراحی اصولی تا نگهداری

  • 7 مورد از بهترین حرکات یوگا برای تسکین استرس

  • آزادی بیان چیست و چه اهمیتی در جامعه دارد؟

  • مطلب بعدی کارت گرافیک های Radeon RX 9070 در ماه مارچ به بازار عرضه می‌شوند
  • مطلب قبلی بنچمارک های اولیه RTX 5090: افزایش عملکرد ناچیز نسبت به RTX 4090
  • آخرین مطالب
  • محبوب‌ترین مطالب
  • مبالغ دریافتی اینترنت پرو

    تکلیف مبالغ دریافتی برای سرویس اینترنت پرو مشخص شد

  • قیمت GTA 6 لو رفت؛ نسخه استاندارد 90 یورو قیمت‌گذاری شده است!

    قیمت GTA 6 لو رفت؛ نسخه استاندارد 90 یورو قیمت‌گذاری شده است!

  • احتمال استفاده از نمایشگر BOE در گلکسی S27؛ تغییری جنجالی در پرچمدار سامسونگ

    احتمال استفاده از نمایشگر BOE در گلکسی S27؛ تغییری جنجالی در پرچمدار سامسونگ

  • احیای بازار کار ایران پس از اتصال مجدد اینترنت

    بازگشت نسبی تحرک به بازار کار ایران پس از اتصال مجدد اینترنت

  • شهرداری تهران توسعه فیبر نوری

    مدیرعامل مخابرات: شهرداری تهران مانع ارتقای توسعه فیبر نوری است

  • ماجرای شکایت کاربران از فروشگاه «پی سی کالا» (PCKala) 7

    متن بیانیه پی سی کالا؛ در میان طوفان بحران، هنوز به عهد خود با مشتریان پایبندیم

  • لیست دستگاه‌ های سامسونگ که به‌روزرسانی One UI 9 را دریافت می‌کنند 6

    لیست دستگاه‌ های سامسونگ که به‌روزرسانی One UI 9 را دریافت می‌کنند

  • مقابله با پیامک‌های تبلیغاتی اپراتورها 2

    جریمه‌های سنگین در انتظار اپراتورها؛ خط و نشان وزارت ارتباطات برای پیامک‌های تبلیغاتی

  • ترامپ: اپل برای تولید تراشه در آمریکا با اینتل همکاری خواهد کرد 1

    ترامپ: اپل برای تولید تراشه در آمریکا با اینتل همکاری خواهد کرد

  • پردازنده‌ های دسکتاپ Raptor Lake Next اینتل با سوکت LGA 1700 عرضه می‌شوند 0

    پردازنده‌ های دسکتاپ Raptor Lake Next اینتل با سوکت LGA 1700 عرضه می‌شوند

آخرین دیدگاه‌ها

  • Avatar
    محسن دیوسار گفته است:
    سلام صددرصد عرضه میشه زودتر از A3× و خیلیای دیگه .ایناهم...
  • Avatar
    محمد علی شیعه منش گفته است:
    A54هیچ جا اسمش نیست
  • Avatar
    مجتبی بدری گفته است:
    درود و عرض ادب تمام این مراحل توضیحاتی که زحمت کشیدید...
  • Avatar
    Abolfazl Riahi گفته است:
    چرا برای A14 عرضه نمیشه؟؟
  • Avatar
    زانیار احمدی گفته است:
    برای A54 عرضه نمیشه ؟؟؟
  • Avatar
    sobhan گفته است:
    سلام
  • Avatar
    مرتضی گفته است:
    به جهنم که گوشی های قدیمی دریافت نکنند همش یه مشت...
  • Avatar
    بریم آن دنیا گفته است:
    دو ماه دیگه. دوباره جنگ و بی برقی توافق نهایی آن...
  • Avatar
    bahman گفته است:
    از نشانه های ایمان قوی و سواد کم هست عمرا درست...
  • Avatar
    علی گفته است:
    همچین گزینه ای تو s22 از خودتون توضیح میدین
راهنمای خرید لپ تاپ گیمینگ 471
راهنمای خرید و مشاوره هایلایت
راهنمای خرید لپ تاپ گیمینگ با بودجه های مختلف (دی 1404)
13 دی 1404
راهنمای خرید لپ تاپ با بودجه های مختلف 1,303
راهنمای خرید و مشاوره هایلایت
راهنمای خرید لپ تاپ با بودجه های مختلف (دی 1404)
10 دی 1404
راهنمای خرید مانیتور آذر 1404 70
راهنمای خرید و مشاوره
راهنمای خرید مانیتور با بهترین قیمت در بودجه‌های مختلف (دی 1404)
6 دی 1404
راهنمای خرید گوشی موبایل آذر 491
راهنمای خرید و مشاوره
راهنمای خرید گوشی موبایل بر اساس بودجه‌های مختلف (دی 1404)
5 دی 1404
7,765
راهنمای خرید و مشاوره سیستم پیشنهادی هایلایت
راهنمای خرید و مشاوره سیستم کامپیوتر با بودجه های مختلف (دی 1404)
3 دی 1404
راهنمای خرید و مشاوره هدفون و هدست با بودجه های مختلف (آبان 1404) 0
اخبار و مقالات راهنمای خرید و مشاوره هایلایت
راهنمای خرید و مشاوره هدفون و هدست با بودجه های مختلف (آبان 1404)
27 آبان 1404
  • سخت‌افزارمگ
  • درباره ما
  • تبلیغات
  • استخدام
سخت‌افزارمگ

© 2026 Sakhtafzarmag.Com. All Rights Reserved.

صفحه نخست » اخبار و مقالات » چرا هوش مصنوعی نمی‌تواند از پس سوالات تاریخی بربیاید؟

ورود

عضویت

رمزتان را گم کرده‌اید؟

عضویت | رمزتان را گم کرده‌اید؟
| بازگشت به ورود