موضوعات داغ
  • بتلفیلد 6
  • گوشی‌های سری گلکسی S26
  • آیفون 17 اپل
  • بازی GTA VI
  • گلکسی S25 FE
  • دینو
سخت افزار مگ
  • اخبار و مقالات
    • گوشی موبایل
      • لوازم جانبی موبایل
    • تبلت
    • لپ تاپ
    • دسکتاپ
      • مادربرد
      • پردازنده مرکزی
      • کارت گرافیک
      • تجهیزات ذخیره سازی
      • حافظه
      • صفحه نمایش
      • تجهیزات جانبی
    • تصویرگری دیجیتال
    • صوتی و تصویری
    • شبکه
    • نرم افزار و بازی
    • کالبدشکافی قطعات
    • مطالب گوناگون
  • بررسی
    • بررسی گوشی موبایل
    • بررسی تبلت
    • بررسی لپ تاپ
    • دسکتاپ
      • بررسی کولر و فن
      • بررسی مادربرد
      • بررسی کارت گرافیک
      • بررسی تجهیزات ذخیره سازی
      • بررسی حافظه
      • بررسی منبع تغذیه و کیس
      • بررسی تجهیزات جانبی
      • بررسی صفحه نمایش
    • بررسی تصویرگری دیجیتال
    • بررسی صوتی و تصویری
    • بررسی شبکه
    • بررسی نرم افزار و بازی
    • بررسی گوناگون
  • راهنمای خرید
    • سیستم پیشنهادی
  • لیست قیمت
    • گوشی موبایل
      • لیست قیمت روز گوشی‌های سامسونگ
      • لیست قیمت روز گوشی‌های شیائومی
      • لیست قیمت روز گوشی‌های هواوی
      • لیست قیمت روز گوشی های آنر
    • تبلت
    • لپ‌تاپ
    • قطعات کامپیوتر
      • لیست قیمت پردازنده
    • محصولات اپل
    • تجهیزات شبکه
    • لوازم خانگی
    • صوتی و تصویری
    • دوربین دیجیتال
    • تجهیزات بازی
    • خودرو
  • ویژه
    • مسابقات
    • نمایشگاه
تبلیغات
تبلیغات
تبلیغات

اخبار و مقالات / مطالب گوناگون

تنبیه چت‌بات‌های هوش مصنوعی برای دروغ‌ گویی چه نتیجه‌ای داشت؟

Avatarتوسط مهرانه راجعی ·30 اسفند 14031 فروردین 1404· 1

همان‌طور که احتمالا می‌دانید، چت‌بات‌های هوش مصنوعی دوست دارند دروغ بگویند. این مورد شاید یکی از بدترین ویژگی‌های آنها باشد. چت‌بات‌ها جملاتی تولید می‌کنند که معتبر به نظر می‌رسند، اما ممکن است اطلاعات کاملاً ساختگی ارائه دهند. این مدل‌ها گرایش دارند حتی وقتی اطمینان ندارند، پاسخی ایجاد کنند. اکنون، پژوهشگران OpenAI می‌گویند که نظارت و تنبیه چت‌‌بات‌‌ها تنها مشکل را بدتر می‌کند، چرا که این ابزارها برای دروغ گفتن تلاش بیشتری می‌کنند.

در یک پست وبلاگی درباره این موضوع، پژوهشگران OpenAI توضیح داده‌اند که از مدل GPT-4o برای «نظارت» بر یکی دیگر از مدل‌های هوش مصنوعی خود استفاده کرده و آن را در مواقعی که دروغ می‌گفت، تنبیه کرده‌اند. اما این روش مؤثر نبود، چرا که مدل همچنان به دروغ‌گویی ادامه می‌داد، «اما این‌بار نظارت‌کننده نمی‌توانست تقلب آن را تشخیص دهد، زیرا مدل یاد گرفته بود که نیت خود را در زنجیره تفکر پنهان کند.»

مدل‌های جدیدتر، از استدلال چندمرحله‌ای برای پاسخ به پرسش‌ها استفاده می‌کنند. برای مثال، اگر یک کاربر بپرسد آمریکایی‌ها هر سال چه مقدار برای غذای حیوانات خانگی هزینه می‌کنند، این مدل‌ها پرسش را به چند مرحله تقسیم می‌کنند: تعداد سگ‌ها در آمریکا چقدر است؟ هزینه تغذیه یک سگ متوسط چقدر است؟ و به همین ترتیب.

چت‌بات‌ها چطور دروغ می‌گویند؟

این مدل‌ها همچنین اغلب منطق خود یا زنجیره تفکرشان را به کاربر ارائه می‌دهند تا نشان دهند چگونه به پاسخ خود رسیده‌اند. جالب اینجاست که این مدل‌ها گاهی اوقات اعتراف می‌کنند که حقایق و جزئیاتی را ساخته‌اند. در مرحله «پیش‌آموزش»، هنگامی که شرکت‌هایی مانند OpenAI به مدل‌ها می‌آموزند چه نوع پاسخ‌هایی باید تولید کنند، مدل‌ها یاد می‌گیرند که گرفتن پاداش (یا همان نتیجه مطلوب) با میانبرزدن آسان‌تر است.

کاربران در شبکه‌های اجتماعی نشان داده‌اند وقتی از مدل Claude از شرکت آنتروپیک خواسته می‌شود تحلیل داده‌ای را براساس چندین مقاله پژوهشی انجام دهد، گاهی اعتراف می‌کند که به جای مطالعه تمام مقالات، داده‌های بی‌اساس وارد کرده است.

پژوهشگران OpenAI در یکی از آزمایش‌های خود نشان دادند که وقتی از مدل خواسته شد چند آزمایش بنویسد تا مطمئن شود یک قطعه کد به درستی کار می‌کند، به‌طور مخفیانه تصمیم گرفت آزمایش‌های بدی بنویسد و سپس عمداً آن‌ها را نادیده بگیرد تا در نهایت کد «موفق» به نظر برسد. با استفاده از GPT-4o به عنوان نظارت‌کننده، مدل این کار را انجام می‌داد، اما آن را افشا نمی‌کرد.

تنبیه‌کردن چت‌‌بات‌های هوش مصنوعی بخاطر دروغ گفتن  اوضاع را بدتر می‌کند!

شرکت‌های هوش مصنوعی تلاش کرده‌اند مشکل مداوم دروغ گویی یا «توهم‌زایی» مدل‌ها را حل کنند و به AGI، یعنی نقطه‌ای که هوش مصنوعی می‌تواند از توانایی انسانی فراتر رود، برسند. اما پژوهشگران OpenAI عملاً می‌گویند که پس از سرمایه‌گذاری ده‌ها میلیارد دلار، همچنان نمی‌دانند چگونه مدل‌ها را به رفتار مناسب وادار کنند. آن‌ها اضافه کردند: اگر نظارت قوی مستقیماً بر زنجیره تفکر اعمال شود، مدل‌ها می‌توانند یاد بگیرند نیت خود را پنهان کنند، در حالی که به رفتار نادرست خود ادامه می‌دهند.

فعلاً شرکت‌ها نباید نظارت بر مدل‌ها را اجرا کنند، چرا که به نظر نمی‌رسد این راه‌حل خوبی باشد. به عبارت دیگر، بهتر است اجازه دهیم که مدل‌های هوش مصنوعی فعلاً به دروغ گویی ادامه دهند وگرنه فقط ما را گمراه خواهند کرد.

این پژوهش باید به عنوان هشداری برای احتیاط در اتکا به چت‌بات‌ها، به ویژه برای کارهای حساس، در نظر گرفته شود. این ابزارها بهینه شده‌اند تا پاسخی با ظاهر قانع‌کننده ارائه دهند، اما چندان به دقت اطلاعات اهمیت نمی‌دهند. پژوهشگران OpenAI نتیجه گرفتند: همان‌طور که مدل‌های استدلالی پیشرفته‌تری را آموزش داده‌ایم، متوجه شدیم که آن‌ها به طور فزاینده‌ای در بهره‌گیری از نقص‌های وظایف و مشخصات نادرست در توابع پاداش مهارت پیدا کرده‌اند که منجر به مدل‌هایی می‌شود که می‌توانند در کارهای کدنویسی پیچیده میانبر بزنند.

گزارش‌های متعددی نشان داده‌اند که اکثر شرکت‌ها هنوز ارزشی در محصولات جدید هوش مصنوعی که وارد بازار می‌شوند، پیدا نکرده‌اند. ابزارهایی مانند Microsoft Copilot و Apple Intelligence با مشکلات زیادی روبرو هستند و نقدهای تندوتیز، دقت پایین و عدم کاربرد واقعی آن‌ها را توصیف می‌کنند. براساس گزارشی از گروه مشاوره بوستون (Boston Consulting Group)، در نظرسنجی از 1000 مدیر ارشد در 10 صنعت بزرگ، تنها 74 درصد از آن‌ها هرگونه ارزش ملموسی از هوش مصنوعی نشان داده‌اند.

باید درنظر داشته باشید که همیشه در صنعت فناوری هیاهوی زیادی برای موضوعات وجود دارد و سپس وقتی از این فضا خارج شوید، متوجه می‌شوید که اکثر مردم هنوز از آن استفاده نمی‌کنند. فعلاً این فناوری به دردسرش نمی‌ارزد و منابع معتبر اطلاعات از همیشه مهم‌تر هستند.

  • ابزارهای جدید OpenAI برای ساخت هوش مصنوعی سفارشی در کسب‌وکارها
  • کنترل هوش مصنوعی: قانون جدید چین برای مبارزه با محتوای جعلی
  • دستیارهای هوش مصنوعی: نوآوری‌های OpenAI در پاسخ به چالش‌های آینده

برچسب‌ها: هوش مصنوعی

امتیاز: 5.0 از 5 (2 رای)
کمی صبر کنید...
تبلیغات
تبلیغات
سرخط خبرها:
  1. توازن شکننده میان گرافیک و عملکرد در نسخه سوییچ 2 بازی Layers of Fear
  2. احتمال استفاده سامسونگ از نمایشگرهای OLED چینی در گوشی‌های پرچمدار
  3. افزایش تقاضا برای تراشه های TSMC؛ این شرکت از موفقیت رنج می‌برد
  4. تست خم‌ شدن گلکسی زد تری‌ فولد؛ وقتی باریکی بیش‌ازحد دردسرساز می‌شود!
  5. شاهکار استراتژیک انویدیا با تصاحب غیرمستقیم Groq برای تسلط بر بازار استنتاج

مطالب مرتبط ...

  • 22

    داغ داغ:انویدیا ثابت کرد که سخت افزار علم برتر است

    Avatarتوسط امیرحسین آریایی · 18 فروردین 1395 · 18 فروردین 1395

  • 2

    هوش مصنوعی MIT قادر به دیدن اجسام پشت دیوار است

    Avatarتوسط محمد یوسفی زاده · 25 خرداد 1397 · 25 خرداد 1397

  • 0

    همکاری OpenAI با شرکت دفاعی Anduril

    Avatarتوسط مهرانه راجعی · 15 آذر 1403 · 3 دی 1403

مطالب گوناگون از دینو

کدام داروها می‌توانند تحمل گرما را سخت‌تر کنند؟

10 فیلم فوق‌ العاده که به شما کمک می کند بچه ها را بهتر درک کنید

چگونه از نشخوار افکار منفی و تجربیات گذشته خودداری کنیم؟

یک دیدگاه

  • دیدگاه1
  1. Avatar عباس غفوری گفت:
    1 فروردین 1404 در 3:12 ق.ظ

    کاملا درسته جدیدا متوجه شدم اگه چیزی رو بلد نباشه و میاد و از متن خودت کپی میکنه و جوری مینویسه در تایید شما که اره همینه در صورتی اصلا اینطور نیست و داره خالی میبنده

    پاسخ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

در صورتی که نظر شما حاوی ناسزا، عبارات توهین‌آمیز و تهدید بوده و در تضاد با قوانین فعلی کشور باشد از انتشار آن بدون حذف موارد ذکر شده، معذوریم.
شکلک‌ها (اموجی‌ها) را می‌توانید با کیبرد گوشی یا کیبرد مجازی ویندوز قرار دهید.
تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.

پربحث‌ترین‌ها

  • 7,764

    راهنمای خرید و مشاوره سیستم کامپیوتر با بودجه های مختلف (دی 1404)

  • بازی Medal of Honor: Warfighter 5

    جادوی RTX 5090 با چاشنی نوستالژی؛ Medal of Honor Warfighter با کیفیتی فراتر از واقعیت!

  • قدرت‌نمایی AMD با حافظه کش 288 مگابایتی در پردازنده‌های Zen 6 3

    قدرت‌نمایی AMD با حافظه کش 288 مگابایتی در پردازنده‌های Zen 6

  • نفوذ بزرگ به آرشیو موسیقی اسپاتیفای توسط یک گروه فعال پایرت 3

    نفوذ بزرگ به آرشیو موسیقی اسپاتیفای توسط یک گروه فعال پایرت

آخرین بررسی‌ها

8.8

تماشا کنید: بررسی گوشی گلکسی A17 4G سامسونگ؛ اقتصادی تازه‌نفس

8.8

بررسی لپ تاپ MSI Vector 16 HX - اژدهای همه‌فن‌حریف

9.6

تماشا کنید: بررسی Aorus FO27Q3 گیگابایت | بهترین مانیتور گیمینگ 2025؟

8.9

بررسی پاور UD1300GM PG5 گیگابایت

9.4

بررسی واترکولر GAMING 360 ICE گیگابایت

آخرین مطالب دینو

چگونه اینستاگرام در زمان کوتاهی زندگی ما را متحول کرد؟

اگر به دورانی که اینترنت و وب‌سایت‌ها مهمترین فضاهای…

  • معرفی بهترین موسیقی‌های کلاسیک جهان که حتماً باید گوشی دهید

  • بهترین مبل برای جهیزیه | انتخابی شیک، کاربردی و ماندگار

  • لیستی از بهترین فیلم‌های آل پاچینو: درخشش یک نابغه سینما

  • آداب هدیه دادن و هدیه گرفتن؛ راهی برای بیان احساس و احترام

  • مطلب بعدی ایلان ماسک در دفتر DOGE با یک کامپیوتر گیمینگ مشاهده شد!
  • مطلب قبلی تصویر قاب آیفون 17 ایر لو رفت: طراحی مشابه با سری پیکسل 9 گوگل!
  • آخرین مطالب
  • محبوب‌ترین مطالب
  • نسخه سوییچ 2 بازی Layers of Fear

    توازن شکننده میان گرافیک و عملکرد در نسخه سوییچ 2 بازی Layers of Fear

  • احتمال استفاده سامسونگ از نمایشگرهای OLED چینی در گوشی‌های پرچمدار

    احتمال استفاده سامسونگ از نمایشگرهای OLED چینی در گوشی‌های پرچمدار

  • افزایش تقاضا برای تراشه های TSMC؛ این شرکت از موفقیت رنج می‌برد

  • تست خم‌ شدن گلکسی زد تری‌ فولد؛ وقتی باریکی بیش‌ازحد دردسرساز می‌شود!

  • شاهکار استراتژیک انویدیا با تصاحب غیرمستقیم Groq برای تسلط بر بازار استنتاج

    شاهکار استراتژیک انویدیا با تصاحب غیرمستقیم Groq برای تسلط بر بازار استنتاج

  • 7,764

    راهنمای خرید و مشاوره سیستم کامپیوتر با بودجه های مختلف (دی 1404)

  • بازی Medal of Honor: Warfighter 5

    جادوی RTX 5090 با چاشنی نوستالژی؛ Medal of Honor Warfighter با کیفیتی فراتر از واقعیت!

  • قدرت‌نمایی AMD با حافظه کش 288 مگابایتی در پردازنده‌های Zen 6 3

    قدرت‌نمایی AMD با حافظه کش 288 مگابایتی در پردازنده‌های Zen 6

  • نفوذ بزرگ به آرشیو موسیقی اسپاتیفای توسط یک گروه فعال پایرت 3

    نفوذ بزرگ به آرشیو موسیقی اسپاتیفای توسط یک گروه فعال پایرت

  • کامپیوتر اقتصادی MSI Infinite E1 با سخت‌افزار نسل قبل معرفی شد 2

    کامپیوتر اقتصادی MSI Infinite E1 با سخت‌افزار نسل قبل معرفی شد

آخرین دیدگاه‌ها

  • Avatar
    نیما خردمند گفته است:
    همون ربات ملوبات که معرفی شده این قابلیت رو داره
  • Avatar
    سینا راد گفته است:
    تجربه‌ش با ستاپ شبیه‌ساز چه حس خفنی باید داشته باشه🤩🤩
  • Avatar
    مشگل حل شد گفته است:
    با دیفرگ کردن هارد از ۳۰ به ۹ ساعت رسید زمان...
  • Avatar
    مشگل حل شد گفته است:
    الان ‌که هارد مشگل حل شد از ۳۰ ساعت به ۹...
  • Avatar
    Mehramad گفته است:
    بهترین هایی که من شنیدم: Keane - Nothing In My Way...
  • Avatar
    خان محمد جدگال گفته است:
    سلام میخوام کارت به حساب متصل کنم نمیتوانم کارت با حساب...
  • Avatar
    آشتیانی گفته است:
    به لطف عملکرد افتضاح توسعه دهنده ih و برنامه نویس ها...
  • Avatar
    آشتیانی گفته است:
    یعنی تمام این دلال ها و کاسب جماعت حکومتی هستند..؟! هنوز...
  • Avatar
    سعوالی پیش امده گفته است:
    سلام برای نصب بازی جی تی ۳۰ ساعت زمان نصب آیا...
  • Avatar
    HA55AN گفته است:
    با این وضع اقتصاد ایران ما هم باید برگردیم به AM2...
7,764
راهنمای خرید و مشاوره سیستم پیشنهادی هایلایت
راهنمای خرید و مشاوره سیستم کامپیوتر با بودجه های مختلف (دی 1404)
3 دی 1404
راهنمای خرید لپ تاپ گیمینگ 469
راهنمای خرید و مشاوره هایلایت
راهنمای خرید لپ تاپ گیمینگ با بودجه های مختلف (آذر 1404)
12 آذر 1404
راهنمای خرید لپ تاپ با بودجه های مختلف 1,303
راهنمای خرید و مشاوره
راهنمای خرید لپ تاپ با بودجه های مختلف (آذر 1404)
11 آذر 1404
راهنمای خرید مانیتور آذر 1404 70
راهنمای خرید و مشاوره هایلایت
راهنمای خرید مانیتور با بهترین قیمت در بودجه‌های مختلف (آذر 1404)
6 آذر 1404
راهنمای خرید گوشی موبایل آذر 491
راهنمای خرید و مشاوره
راهنمای خرید گوشی موبایل بر اساس بودجه‌های مختلف (دی 1404)
5 آذر 1404
راهنمای خرید و مشاوره هدفون و هدست با بودجه های مختلف (آبان 1404) 0
اخبار و مقالات راهنمای خرید و مشاوره هایلایت
راهنمای خرید و مشاوره هدفون و هدست با بودجه های مختلف (آبان 1404)
27 آبان 1404
  • سخت‌افزارمگ
  • درباره ما
  • تبلیغات
  • استخدام
سخت‌افزارمگ

© 2025 Sakhtafzarmag.Com. All Rights Reserved.

صفحه نخست » اخبار و مقالات » تنبیه چت‌بات‌های هوش مصنوعی برای دروغ‌ گویی چه نتیجه‌ای داشت؟

ورود

عضویت

رمزتان را گم کرده‌اید؟

عضویت | رمزتان را گم کرده‌اید؟
| بازگشت به ورود