نتایج یک پژوهش تازه، تصویری تجربی و اولیه از چگونگی دگرگونی ساختار جستجو توسط هوش مصنوعی مولد ارائه میدهد. در حالی که موتورهای جستجوی سنتی همچنان بر پایه میزان محبوبیت و رتبهبندی سایتها عمل میکنند، سیستمهای مبتنی بر هوش مصنوعی در حال شکلدهی به مدلی تازه هستند که بر «ترکیب و تلفیق اطلاعات» تکیه دارد؛ مدلی که مرز میان بازیابی دادهها و تفسیر آنها را محو میکند.
یک مطالعه دانشگاهی جدید که نتایج جستجوی وب سنتی را با خروجی سیستمهای هدایتشده توسط هوش مصنوعی مقایسه کرده، نشان داده که ابزارهای AI اغلب به منابع کمتر شناختهشده یا غیرمعمول متکی هستند. یافتهها شکاف روبهرشدی را میان شیوه عملکرد موتورهای جستجوی کلاسیک و سامانههای مبتنی بر مدلهای زبانی بزرگ در گردآوری و نمایش اطلاعات آنلاین آشکار میکند.
گروهی از پژوهشگران دانشگاه روهر بوخوم و موسسه سیستمهای نرمافزاری ماکس پلانک این تحقیق را انجام دادهاند و در قالب یک مقاله پیشانتشار با عنوان «ویژگییابی جستجوی وب در عصر هوش مصنوعی مولد» منتشر کردند. در این مطالعه، تفاوت میان چندین موتور جستجوی مبتنی بر هوش مصنوعی از جمله گوگل AI Overviews، جمینای 2.5 فلش و دو نسخه از مدل GPT-4o شرکت OpenAI بررسی شده است؛ یکی نسخه دارای قابلیت جستجوی وب درونی و دیگری ابزار GPT-4o Search Tool که تنها در صورت نیاز مدل به دادههای بیرونی به اینترنت دسترسی پیدا میکند.

AI به لینکهای برتر گوگل اعتماد ندارد!
برای دههها، موتورهای جستجو براساس ایندکسگذاری و رتبهبندی صفحات وب عمل کردهاند و فهرستی از لینکها را با اولویت میزان ارتباط و اعتبار نمایش دادهاند. اما سیستمهای هوش مصنوعی مولد، اطلاعات را از منابع گوناگون جمعآوری کرده و پاسخی فشرده و ترکیبی ارائه میدهند. هدف پژوهشگران این بود که تأثیر این تغییر بنیادین را بر نوع وبسایتهایی که پاسخهای تولیدشده از آنها تغذیه میشود، اندازهگیری کنند.
برای آزمودن فرضیه خود، پژوهشگران هزاران پرسش نمونه را از چند مجموعه داده عمومی انتخاب کردند. این دادهها شامل پرسشهایی از تعاملات واقعی کاربران با ChatGPT در مجموعه WildChat، موضوعات عمومی و سیاسی موجود در پایگاه AllSides (که برای پایش سوگیری رسانهای طراحی شده) و فهرست 100 مورد از پرفروشترین محصولات آمازون بود. همچنین، موضوعات داغ و پرجستجوی گوگل در آن زمان برای مقایسه مورد استفاده قرار گرفت.
هر پرسش بهطور جداگانه در موتور جستجوی سنتی گوگل و سامانههای مبتنی بر هوش مصنوعی وارد شد. پژوهشگران سپس دامنههای وب ذکرشده در پاسخهای تولیدشده توسط هوش مصنوعی را با دامنههای موجود در 10 لینک اول و 100 لینک نخست نتایج جستجوی گوگل مقایسه کردند.
تفاوتها چشمگیر بود. با استفاده از شاخص مستقل Tranco که دامنههای وب را بر اساس میزان بازدید رتبهبندی میکند، مطالعه نشان داد نتایج جستجوی مبتنی بر هوش مصنوعی بهطور مداوم از وبسایتهایی خارج از دستههای پربازدید استفاده میکنند. در AI Overviews گوگل، بیش از نیمی از منابع ذکرشده در 10 نتیجه ارگانیک برتر گوگل برای همان پرسش وجود نداشتند و 40 درصد از آنها حتی در میان 100 لینک نخست هم دیده نمیشدند.
نتایج جستجوی جمینای الگوی مشابهی را نشان داد و اغلب دامنههایی را ارجاع میداد که خارج از 1000 سایت برتر Tranco قرار داشتند. پژوهشگران خاطرنشان کردند که منبع «میانگین» ارجاعشده توسط جمینای در سطحی پایینتر از آستانه وبسایتهای پرمراجعه قرار داشت. هرچند GPT-4o و نسخه دارای دسترسی وب آن نیز از منابع کمتر شناختهشده استفاده میکردند، اما بیشتر به دامنههای سازمانی مانند صفحات رسمی شرکتها و دانشنامهها تکیه داشتند تا شبکههای اجتماعی یا انجمنهای گفتوگو.
این پژوهش به این نتیجه نرسید که نتایج جستجوی هوش مصنوعی کیفیت پایینتری دارند، بلکه نشان داد این سیستمها رویکرد متفاوتی به بازیابی اطلاعات دارند. با بهرهگیری از ابزار ارزیابی مستقل LLOOM که در دانشگاه استنفورد طراحی شده، تیم تحقیق دریافت که سامانههای جستجوی مبتنی بر هوش مصنوعی به اندازه 10 لینک نخست نتایج سنتی، مفاهیم گوناگونی را پوشش میدهند. این یافته نشان میدهد که اگرچه پاسخهای تولیدشده توسط هوش مصنوعی از نظر گستره اطلاعات مشابه بودند، اما در روند خلاصهسازی، برخی جزئیات ظریف را که در نتایج سنتی حفظ میشود، حذف میکردند.
این پدیده بهویژه در مورد عبارات جستوجوی مبهم، مانند نامهایی که میان چند فرد مشترکاند، آشکارتر بود. در چنین مواردی، جستجوی لینکمحور پوشش زمینهای گستردهتری ارائه میداد، در حالی که پاسخهای هوش مصنوعی معمولاً تمام موارد را در یک تفسیر واحد ادغام کرده و برخی نتایج جایگزین را حذف میکردند.
سیستمهای مولد از دانش پیشآموزشدیده مدلهای زبانی بزرگ بهرهمند بودند و همین موضوع به آنها برتری قابل توجهی در ترکیب و بازسازی زمینههای اطلاعاتی میداد. برای مثال، GPT-4o مجهز به ابزار جستوجو گاهی خلاصههایی جامع ارائه میداد بدون آنکه هیچ منبع خارجی را ذکر کند و کاملاً به پایگاه دانش درونی مدل متکی بود. این رفتار در موضوعات تثبیتشده و عمومی مفید واقع میشد اما در مورد رویدادهای تازه یا اخبار فوری دقت کمتری داشت.
زمانی که این سیستم با جستوجوهای داغ گوگل در اواسط سپتامبر 2025 آزمایش شد، نسخه دارای دسترسی وب GPT-4o اغلب در بازیابی اطلاعات بهروز ناکام ماند و پاسخهایی کلی یا عباراتی مانند درخواست توضیح بیشتر یا اذعان به عدم اطمینان تولید کرد. این امر نشان میداد که سیستم تنها در صورت نیاز قطعی به منابع بیرونی مراجعه میکند و در حالت عادی تمایل دارد به دادههای داخلی تکیه کند.
نویسندگان مطالعه تأکید کردند که برای ارزیابی دقت یا کیفیت جستجوی مبتنی بر هوش مصنوعی مولد، باید معیارهای تازهای طراحی شود. آنها پیشنهاد دادند پژوهشهای آینده به جای تکیه بر شاخصهای سنتی رتبهبندی، از چارچوبهایی استفاده کنند که به تنوع منابع، گستره پوشش مفهومی و توانایی سیستمهای هوش مصنوعی در ترکیب و ارائه اطلاعات منسجم توجه داشته باشد.








دیدگاهتان را بنویسید