哥伦比亚大学数字新闻研究中心近日研究发现,八款主流AI搜索引擎(ChatGPT Search、Perplexity、Gemini等)的平均准确率仅为六成,且对错误答案表现出过度自信。研究选取200篇来自20家新闻机构的报道进行测试,要求AI准确引用文章内容、来源及链接。结果显示,除Perplexity及其付费版表现稍好外,其余AI工具表现不佳。其中,ChatGPT Search虽回答了全部查询,但‘完全正确’率仅28%,‘完全错误’率高达57%;X旗下Grok AI的Grok-3 Search错误率更是达到94%。微软Copilot在200次查询中,仅16次‘完全正确’,66次‘完全错误’,总体错误率接近70%。令人担忧的是,这些AI工具的开发公司并未公开这些问题,却仍收取每月20至200美元的订阅费用,且付费版的错误率更高。该研究揭示了大语言模型易出错且难以识别自身错误的问题,再次引发外界对AI搜索工具可靠性的关注。
原文链接
本文链接:https://kx.umi6.com/article/15408.html
转载请注明文章出处
相关推荐
换一换
哥伦比亚大学研究:AI 搜索工具平均准确率仅六成,且自信满满“不认错”
2025-03-13 17:29:39
腾讯公布大语言模型训练专利 可提高模型准确性
2025-02-08 14:29:56
研究称 ChatGPT 回答的编程问题错误率 52%,但 39% 人类程序员没看出来
2024-05-25 09:21:39
人工智能测谎技术问世:比人类更强,但需谨慎使用
2024-07-08 20:58:04
哥大最新调研:多款 AI 搜索引用错误率高达 60%,付费版本错误率更高
2025-03-19 18:49:04
中国AI大模型工业应用指数发布
2024-07-04 22:04:02
新研究:AI测谎能力比人类更强 但需谨慎使用
2024-07-15 22:41:17
准确率可达 70%,科学家利用 AI 解读狗的叫声
2024-06-07 21:57:42
新研究:人工智能生成内容不准确与失语症类似
2025-05-20 12:43:14
AI总结性产品是不是鸡肋?
2024-06-11 11:01:13
打造金融机构的AI操作系统 2026金融行业钉峰会在郑州圆满举行
2026-01-23 18:09:30
国家电网的供应商冲击IPO,左手能源右手机器人
2026-01-22 13:57:42
黄仁勋谈AI泡沫:泡沫产生是因为投资规模空前庞大 巨额投资是为了构建AI基础设施
2026-01-22 16:01:49
631 文章
431063 浏览
24小时热文
更多
-
2026-01-23 18:11:40 -
2026-01-23 18:10:36 -
2026-01-23 18:09:30