دقت پایین موتورهای جستجوی هوش مصنوعی؛ آیا کاربران فریب خوردهاند؟

به گزارش ایتنا[3] و به نقل از تکاسپات[4]، محققان 200 مقاله خبری از 20 رسانه مختلف را بررسی کردند و صحت پاسخهای AI را بر اساس استناد به مقاله، سازمان خبری، و URL آن سنجیدند. نتایج نشان داد که تنها پرپلکسیتی و پرپلکسیتی پرو عملکرد نسبتاً بهتری داشتند، در حالی که سایر موتورهای جستجو مانند ChatGPT Search و Grok-3 دقت بسیار پایینی داشتند.
ChatGPT Search در 57 درصد موارد کاملاً نادرست بود و تنها در 28 درصد مواقع به طور کامل صحیح پاسخ داد. با این حال، این ابزار تنها مدلی بود که به همه 200 جستجو پاسخ داد. در مقابل، Grok-3 از شرکت X (توییتر سابق) در 94 درصد موارد پاسخهای نادرست ارائه داد، و کوپایلوت مایکروسافت نیز از 200 جستجو، 104 مورد را بیپاسخ گذاشت.

این مطالعه نگرانیهای موجود درباره «توهمات» هوش مصنوعی را تأیید میکند، چرا که این مدلها حتی زمانی که اشتباه میکنند، با اطمینان کامل از درستی پاسخهای خود دفاع میکنند. با وجود این میزان خطا، شرکتهای فناوری همچنان برای ارائه نسخههای بهروزتر این ابزارها هزینههای بالایی (بین 20 تا 200 دلار در ماه) از کاربران دریافت میکنند، بدون اینکه بهطور شفاف به ضعفهای مدلهای خود اشاره کنند.
در حالی که برخی کارشناسان، مانند لنس اولانوف از TechRadar، از عملکرد سریع و بدون تبلیغ ChatGPT Search راضی هستند، اما دادههای این تحقیق نشان میدهد که کاربران باید نسبت به دقت اطلاعات ارائهشده توسط هوش مصنوعی محتاط باشند.
References
Authors: صاحبخبران - جدیدترین و آخرین اخبار ایران و جهان - علمی-فناوری