哥伦比亚大学数字新闻研究中心近日研究发现,八款主流AI搜索引擎(ChatGPT Search、Perplexity、Gemini等)的平均准确率仅为六成,且对错误答案表现出过度自信。研究选取200篇来自20家新闻机构的报道进行测试,要求AI准确引用文章内容、来源及链接。结果显示,除Perplexity及其付费版表现稍好外,其余AI工具表现不佳。其中,ChatGPT Search虽回答了全部查询,但‘完全正确’率仅28%,‘完全错误’率高达57%;X旗下Grok AI的Grok-3 Search错误率更是达到94%。微软Copilot在200次查询中,仅16次‘完全正确’,66次‘完全错误’,总体错误率接近70%。令人担忧的是,这些AI工具的开发公司并未公开这些问题,却仍收取每月20至200美元的订阅费用,且付费版的错误率更高。该研究揭示了大语言模型易出错且难以识别自身错误的问题,再次引发外界对AI搜索工具可靠性的关注。
原文链接
本文链接:https://kx.umi6.com/article/15408.html
转载请注明文章出处
相关推荐
.png)
换一换
人工智能测谎技术问世:比人类更强,但需谨慎使用
2024-07-08 20:58:04
准确率可达 70%,科学家利用 AI 解读狗的叫声
2024-06-07 21:57:42
新研究:人工智能生成内容不准确与失语症类似
2025-05-20 12:43:14
中国AI大模型工业应用指数发布
2024-07-04 22:04:02
研究称 ChatGPT 回答的编程问题错误率 52%,但 39% 人类程序员没看出来
2024-05-25 09:21:39
AI总结性产品是不是鸡肋?
2024-06-11 11:01:13
新研究:AI测谎能力比人类更强 但需谨慎使用
2024-07-15 22:41:17
哥伦比亚大学研究:AI 搜索工具平均准确率仅六成,且自信满满“不认错”
2025-03-13 17:29:39
腾讯公布大语言模型训练专利 可提高模型准确性
2025-02-08 14:29:56
哥大最新调研:多款 AI 搜索引用错误率高达 60%,付费版本错误率更高
2025-03-19 18:49:04
高盛:由于美联储预期降息 预计到2026年中期标普500指数将上涨6%
2025-09-08 15:00:28
OpenAI 重组“模型行为”团队,重点任务是让 ChatGPT“有性格”
2025-09-06 23:39:46
项目开发调试周期缩短至8小时 行业首个智能仓储AI大脑发布
2025-09-07 13:45:23
476 文章
178373 浏览
24小时热文
更多

-
2025-09-08 15:00:28
-
2025-09-08 14:59:20
-
2025-09-08 14:00:34