موضوعات داغ
  • نمایشگاه کامپیوتکس ۲۰۲۵
  • بازی GTA VI
  • هوش مصنوعی
  • استارلینک
  • چت‌بات‌ها
  • دینو
سخت افزار مگ
  • اخبار و مقالات
    • گوشی موبایل
      • لوازم جانبی موبایل
    • تبلت
    • لپ تاپ
    • دسکتاپ
      • مادربرد
      • پردازنده مرکزی
      • کارت گرافیک
      • تجهیزات ذخیره سازی
      • حافظه
      • صفحه نمایش
      • تجهیزات جانبی
    • تصویرگری دیجیتال
    • صوتی و تصویری
    • شبکه
    • نرم افزار و بازی
    • کالبدشکافی قطعات
    • مطالب گوناگون
  • لیست قیمت
    • گوشی موبایل
      • لیست قیمت روز گوشی‌های سامسونگ
      • لیست قیمت روز گوشی‌های شیائومی
      • لیست قیمت روز گوشی‌های هواوی
      • لیست قیمت روز گوشی های آنر
    • تبلت
    • لپ‌تاپ
    • قطعات کامپیوتر
      • لیست قیمت پردازنده
    • محصولات اپل
    • تجهیزات شبکه
    • لوازم خانگی
    • صوتی و تصویری
    • دوربین دیجیتال
    • تجهیزات بازی
    • خودرو
  • بررسی
    • بررسی گوشی موبایل
    • بررسی تبلت
    • بررسی لپ تاپ
    • دسکتاپ
      • بررسی کولر و فن
      • بررسی مادربرد
      • بررسی کارت گرافیک
      • بررسی تجهیزات ذخیره سازی
      • بررسی حافظه
      • بررسی منبع تغذیه و کیس
      • بررسی تجهیزات جانبی
      • بررسی صفحه نمایش
    • بررسی تصویرگری دیجیتال
    • بررسی صوتی و تصویری
    • بررسی شبکه
    • بررسی نرم افزار و بازی
    • بررسی گوناگون
  • راهنمای خرید
    • سیستم پیشنهادی
  • دانلود
  • ویژه
    • مسابقات
    • نمایشگاه
تبلیغات
تبلیغات
تبلیغات

اخبار و مقالات / مطالب گوناگون

چرا هوش مصنوعی نمی‌تواند از پس سوالات تاریخی بربیاید؟

Avatarتوسط مهرانه راجعی ·2 بهمن 14032 بهمن 1403· 0

هوش مصنوعی ممکن است در برخی وظایف مانند کدنویسی یا تولید پادکست عملکرد فوق‌العاده‌ای داشته باشد، اما طبق نتایج یک مقاله جدید، در آزمون پیشرفته تاریخ چندان موفق نیست.

گروهی از پژوهشگران یک معیار جدید به نام Hist-LLM طراحی کرده‌اند تا عملکرد سه مدل زبانی بزرگ برتر (LLM) را روی سوالات تاریخی آزمایش کنند: GPT-4 از OpenAI، Llama از متا، و جمینای از گوگل. معیار Hist-LLM، صحت پاسخ‌ها را بر اساس بانک اطلاعات تاریخ جهانی Seshat، پایگاه داده وسیعی از دانش تاریخی به نام الهه خرد مصر باستان، آزمایش می‌کند.

طبق گفته پژوهشگران وابسته به موسسه تحقیقاتی Complexity Science Hub (CSH) در اتریش، نتایجی که ماه گذشته در کنفرانس برجسته هوش مصنوعی NeurIPS ارائه شد، ناامیدکننده بود. بهترین عملکرد متعلق به GPT-4 Turbo بود که تنها حدود 46 درصد دقت داشت، یعنی کمی بیشتر از حدس‌زدن تصادفی.

نکته اصلی مطالعه این است که LLMها در عین درخشش، هنوز فاقد عمق درک لازم برای تاریخچه پیشرفته هستند. ماریا دل ریو-چانونا، یکی از نویسندگان مقاله و استادیار علوم کامپیوتر در دانشگاه کالج لندن گفت: این مدل‌ها در ارائه حقایق ساده عالی‌اند، اما وقتی صحبت از سوالات پیچیده و پیشرفته تاریخی در سطح دکتری می‌شود، هنوز به این سطح نرسیده‌اند.

پژوهشگران نمونه‌هایی از سوالات تاریخی را که مدل‌های زبانی نتوانستند به درستی پاسخ دهند، با وبسایت TechCrunch به اشتراک گذاشتند. برای مثال، از GPT-4 Turbo پرسیده شد که آیا زره فلس‌دار (scale armor) در دوره‌ای خاص در مصر باستان وجود داشته است یا خیر. این مدل پاسخ مثبت داد، در حالی که این فناوری 1500 سال بعد در مصر ظاهر شد.

چرا مدل‌های هوش مصنوعی در پاسخ‌دهی به سوالات تاریخی پیشرفته ضعیف هستند؟

همانطور که می‌بینید، مدل‌های هوش مصنوعی می‌توانند به سوالات بسیار پیچیده درباره موضوعاتی مانند کدنویسی پاسخ دهند، اما در تاریخ ضعیف عمل می‌کنند. حالا چرا؟ در این زمینه، دل ریو-چانونا معتقد است این مدل‌های زبانی از داده‌های تاریخی برجسته و رایج استفاده می‌کنند و در بازیابی اطلاعات تاریخی کمترشناخته‌شده دچار مشکل می‌شوند.

چرا هوش مصنوعی نمی‌تواند از پس سوالات تاریخی بربیاید؟

برای مثال، پژوهشگران از GPT-4 پرسیدند که آیا مصر باستان در یک دوره خاص تاریخی، ارتش دائمی حرفه‌ای داشته است یا خیر. پاسخ درست «خیر» است، اما مدل زبانی به اشتباه پاسخ مثبت داد. دلیل آن هم این است که اطلاعات عمومی زیادی درباره سایر امپراتوری‌های باستانی مانند ایران، که ارتش دائمی داشتند، وجود دارد.

دل ریو-چانونا توضیح داد: اگر A و B را 100 بار بشنوید و C را تنها یک بار و سپس سوالی درباره C از شما پرسیده شود، ممکن است فقط A و B را به یاد بیاورید و سعی کنید از آن‌ها نتیجه‌گیری کنید.

پژوهشگران همچنین به حقایق دیگری از جمله اینکه مدل‌های OpenAI و Llama در مورد برخی مناطق مانند آفریقای جنوب صحرای بزرگ عملکرد بدتری داشتند، پی بردند. این امز احتمالاً نشان‌دهنده سوگیری در داده‌های آموزشی آن‌ها است.

پیتر تورچین، که رهبری این مطالعه را بر عهده داشت و یکی از اعضای هیئت علمی CSH است، گفت که این نتایج نشان می‌دهد مدل‌های زبانی بزرگ هنوز هم در برخی حوزه‌ها جایگزین انسان‌ها نیستند.

با این حال، پژوهشگران امیدوارند که مدل‌های زبانی بتوانند در آینده به مورخان کمک کنند. آن‌ها با اضافه‌کردن داده‌های بیشتر از مناطق کمترنمایان‌شده و طراحی سوالات پیچیده‌تر، در حال کار بر روی بهبود این مورد هستند.

  • چرا زبان مدل جدید هوش مصنوعی OpenAI وسط پاسخ به فارسی تغییر می‌کند؟
  • معرفی کامل Runway AI: هوش مصنوعی ساخت ویدیو
  • بیانیه رسمی NVIDIA درباره قانون اشتباه «انتشار هوش مصنوعی» دولت بایدن

برچسب‌ها: هوش مصنوعی

امتیاز: 5.0 از 5 (1 رای)
کمی صبر کنید...
تبلیغات
تبلیغات
سرخط خبرها:
  1. گوشی‌ های ویوو S30 و S30 پرو مینی رونمایی شدند
  2. ابعاد سوکت LGA 1954 برای پردازنده‌های Nova Lake اینتل مشابه LGA 1700 و 1851 است
  3. پروژه GTA: Recall San Andreas محتوای حذف‌شده از نسخه بتای بازی را بازمی‌گرداند
  4. بازی The Witcher 3: Wild Hunt رکورد می‌شکند؛ فروش 60 میلیون نسخه‌ای!
  5. مانیتور AOC AGON PRO AG276UZD با رزولوشن 4K و نرخ تازه‌سازی 240 هرتز معرفی شد

مطالب مرتبط ...

  • 1

    تکنولوژی خیره کننده صحنه آهسته انویدیا

    Avatarتوسط امیرحسین آریایی · 29 خرداد 1397 · 22 اسفند 1398

  • 2

    5 تغییری که بهتر است در آینده دوربین‌های دیجیتال ببینیم چیست؟

    Avatarتوسط سیمین نوربخش · 27 بهمن 1397 · 27 بهمن 1397

  • 0

    مدیرعامل گوگل: هوش‌مصنوعی می‌تواند مانند آتش مفید و مخرب باشد

    Avatarتوسط سیمین نوربخش · 1 بهمن 1396 · 22 اسفند 1398

مطالب گوناگون از دینو

6 ترند که در دکوراسیون خانه سال 2025 می‌ بینید

حقیقت هایی جالب در مورد بدن زنان و مردان که کمتر کسی از آن اطلاع دارد

رفتار های نادرست والدین منجر به مشکلات روانی فرزند در بزرگسالی می شود

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

در صورتی که نظر شما حاوی ناسزا، عبارات توهین‌آمیز و تهدید بوده و در تضاد با قوانین فعلی کشور باشد از انتشار آن بدون حذف موارد ذکر شده، معذوریم.
شکلک‌ها (اموجی‌ها) را می‌توانید با کیبرد گوشی یا کیبرد مجازی ویندوز قرار دهید.
تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.

پربحث‌ترین‌ها

  • راهنمای خرید و مشاوره سیستم کامپیوتر با بودجه های مختلف (خرداد 1404) 7,756

    راهنمای خرید و مشاوره سیستم کامپیوتر با بودجه های مختلف (خرداد 1404)

  • 2

    انویدیا با فروش تراشه Blackwell جدید در چین 10 میلیارد دلار درآمد کسب می‌کند

  • تلویزیون های کوانتوم دات واقعی و تقلبی 1

    تلویزیون‌های کوانتوم دات: فناوری واقعی یا یک شعار تبلیغاتی؟

  • طرح مناطق آزاد سایبری 1

    نام جدید اینترنت طبقاتی مشخص شد: مناطق آزاد سایبری!

آخرین بررسی‌ها

9.3

بررسی کارت گرافیک گیگابایت RTX 5080 16GB GAMING OC

8.7

بررسی واترکولر سفید XPG LEVANTE X 240

8.9

بررسی پاور گرین GREEN 1000W GXD GOLD

9.5

بررسی کیت رم VENGEANCE 2x24GB CU-DIMM 8200MT/s CL40 کورسیر

9.1

تماشا کنید: بررسی گلکسی S25 و S25+: دوست‌داشتنی و نادیده گرفته‌شده

آخرین مطالب دینو

چرا موی انسان‌ به اندازه سایر پستانداران نیست؟

تا به حال فکر کرده‌اید چرا بدن شما مانند…

  • ارتباط نگران‌کننده بین روغن‌ های پخت‌وپز و سرطان

  • در خانه کفش نپوشید؛ عادتی کوچک با فواید بزرگ برای سلامت

  • استفاده از فناوری در سنین بالا خطر زوال عقل را کاهش می‌دهد

  • این استراتژی ساده کاهش وزن از کالری‌شماری مؤثرتر است!

  • مطلب بعدی کارت گرافیک های Radeon RX 9070 در ماه مارچ به بازار عرضه می‌شوند
  • مطلب قبلی بنچمارک های اولیه RTX 5090: افزایش عملکرد ناچیز نسبت به RTX 4090
  • آخرین مطالب
  • محبوب‌ترین مطالب
  • گوشی‌ های ویوو S30 و S30 پرو مینی رونمایی شدند

  • ابعاد سوکت LGA 1954 برای پردازنده‌های Nova Lake اینتل مشابه LGA 1700 و 1851 است

  • پروژه GTA: Recall San Andreas

    پروژه GTA: Recall San Andreas محتوای حذف‌شده از نسخه بتای بازی را بازمی‌گرداند

  • فروش بازی The Witcher 3

    بازی The Witcher 3: Wild Hunt رکورد می‌شکند؛ فروش 60 میلیون نسخه‌ای!

  • مانیتور AOC AGON PRO AG276UZD با رزولوشن 4K و نرخ تازه‌سازی 240 هرتز معرفی شد

  • راهنمای خرید و مشاوره سیستم کامپیوتر با بودجه های مختلف (خرداد 1404) 7,756

    راهنمای خرید و مشاوره سیستم کامپیوتر با بودجه های مختلف (خرداد 1404)

  • 2

    انویدیا با فروش تراشه Blackwell جدید در چین 10 میلیارد دلار درآمد کسب می‌کند

  • تلویزیون های کوانتوم دات واقعی و تقلبی 1

    تلویزیون‌های کوانتوم دات: فناوری واقعی یا یک شعار تبلیغاتی؟

  • طرح مناطق آزاد سایبری 1

    نام جدید اینترنت طبقاتی مشخص شد: مناطق آزاد سایبری!

  • 0

    گوشی‌ های ویوو S30 و S30 پرو مینی رونمایی شدند

آخرین دیدگاه‌ها

  • Avatar
    حمید گفته است:
    تلویزیونای کوانتوم دات خوبن، ولی یه چیزی رو که نمیتونم باهاش...
  • Avatar
    رضا گفته است:
    بعد از اینترنت نوبت آب و هواست تا طبقه بندی بشه...
  • Avatar
    حسن گفته است:
    لطفا کامنت های ۱۰۰٪ بی ربط به موضوع خبر رو منتشر...
  • Avatar
    محمد علی صالحی گفته است:
    سلام میشه توضیح بدین که موقه ای که من سرمایه‌گذاری کردم...
  • Avatar
    Fadia گفته است:
    الان چی بهنام
  • Avatar
    ناشناس گفته است:
    با عرض سلام بردارم من کمی شاژر اینترنت زیااد بگیرید بله...
  • Avatar
    Sadam گفته است:
    من از برنامه استفاده میکنم
  • Avatar
    Sana بلوچ گفته است:
    عالی
  • Avatar
    Sana بلوچ گفته است:
    سلام
  • Avatar
    حسن گفته است:
    کامل نه چون ویندوز ۱۰ وای فای ۷ رو ساپورت نمیکنه...
راهنمای خرید و مشاوره سیستم کامپیوتر با بودجه های مختلف (خرداد 1404) 7,756
راهنمای خرید و مشاوره سیستم پیشنهادی هایلایت
راهنمای خرید و مشاوره سیستم کامپیوتر با بودجه های مختلف (خرداد 1404)
5 خرداد 1404
راهنمای خرید تبلت 7
تبلت راهنمای خرید و مشاوره هایلایت
راهنمای خرید تبلت بر اساس بودجه‌های مختلف (بهار 1404)
31 اردیبهشت 1404
راهنمای خرید ساعت هوشمند 4
راهنمای خرید و مشاوره
راهنمای خرید ساعت هوشمند و مچ بند با بودجه‌های مختلف (بهار 1404)
30 اردیبهشت 1404
راهنمای خرید پاور بانک با بودجه‌های مختلف 1
راهنمای خرید و مشاوره هایلایت
راهنمای خرید پاور بانک با بودجه‌های مختلف (بهار 1404)
28 اردیبهشت 1404
راهنمای خرید ماوس و کیبورد 2
راهنمای خرید و مشاوره
راهنمای خرید موس و کیبورد با بودجه‌های مختلف (اردیبهشت 1404)
27 اردیبهشت 1404
راهنمای خرید لپ تاپ گیمینگ 468
راهنمای خرید و مشاوره
راهنمای خرید لپ تاپ گیمینگ با بودجه های مختلف (اردیبهشت 1404)
23 اردیبهشت 1404
  • سخت‌افزارمگ
  • درباره ما
  • تبلیغات
  • استخدام
سخت‌افزارمگ

© 2025 Sakhtafzarmag.Com. All Rights Reserved.

صفحه نخست » اخبار و مقالات » چرا هوش مصنوعی نمی‌تواند از پس سوالات تاریخی بربیاید؟

ورود

عضویت

رمزتان را گم کرده‌اید؟

عضویت | رمزتان را گم کرده‌اید؟
| بازگشت به ورود