哥伦比亚大学数字新闻研究中心近日研究发现,八款主流AI搜索引擎(ChatGPT Search、Perplexity、Gemini等)的平均准确率仅为六成,且对错误答案表现出过度自信。研究选取200篇来自20家新闻机构的报道进行测试,要求AI准确引用文章内容、来源及链接。结果显示,除Perplexity及其付费版表现稍好外,其余AI工具表现不佳。其中,ChatGPT Search虽回答了全部查询,但‘完全正确’率仅28%,‘完全错误’率高达57%;X旗下Grok AI的Grok-3 Search错误率更是达到94%。微软Copilot在200次查询中,仅16次‘完全正确’,66次‘完全错误’,总体错误率接近70%。令人担忧的是,这些AI工具的开发公司并未公开这些问题,却仍收取每月20至200美元的订阅费用,且付费版的错误率更高。该研究揭示了大语言模型易出错且难以识别自身错误的问题,再次引发外界对AI搜索工具可靠性的关注。
原文链接
本文链接:https://kx.umi6.com/article/15408.html
转载请注明文章出处
相关推荐
换一换
哥大最新调研:多款 AI 搜索引用错误率高达 60%,付费版本错误率更高
2025-03-19 18:49:04
腾讯公布大语言模型训练专利 可提高模型准确性
2025-02-08 14:29:56
中国AI大模型工业应用指数发布
2024-07-04 22:04:02
人工智能测谎技术问世:比人类更强,但需谨慎使用
2024-07-08 20:58:04
新研究:人工智能生成内容不准确与失语症类似
2025-05-20 12:43:14
哈佛最新研究:用AI大型语言模型看病 80%的初步诊断都是错的
2026-04-15 19:18:55
AI总结性产品是不是鸡肋?
2024-06-11 11:01:13
准确率可达 70%,科学家利用 AI 解读狗的叫声
2024-06-07 21:57:42
研究称 ChatGPT 回答的编程问题错误率 52%,但 39% 人类程序员没看出来
2024-05-25 09:21:39
新研究:AI测谎能力比人类更强 但需谨慎使用
2024-07-15 22:41:17
CVPR 2026 | 支撑春晚合肥 7 分钟的4K画面奇观 PS-SR让视频超分不用在速度与质量间为难
2026-06-08 11:24:08
人类药丸?Anthropic为什么要搞AI不扩散条约
2026-06-07 13:33:45
今年CVPR看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断
2026-06-06 15:50:06
713 文章
618539 浏览
24小时热文
更多
-
2026-06-08 23:49:41 -
2026-06-08 21:46:02 -
2026-06-08 19:42:13