哥伦比亚大学数字新闻研究中心近日研究发现,八款主流AI搜索引擎(ChatGPT Search、Perplexity、Gemini等)的平均准确率仅为六成,且对错误答案表现出过度自信。研究选取200篇来自20家新闻机构的报道进行测试,要求AI准确引用文章内容、来源及链接。结果显示,除Perplexity及其付费版表现稍好外,其余AI工具表现不佳。其中,ChatGPT Search虽回答了全部查询,但‘完全正确’率仅28%,‘完全错误’率高达57%;X旗下Grok AI的Grok-3 Search错误率更是达到94%。微软Copilot在200次查询中,仅16次‘完全正确’,66次‘完全错误’,总体错误率接近70%。令人担忧的是,这些AI工具的开发公司并未公开这些问题,却仍收取每月20至200美元的订阅费用,且付费版的错误率更高。该研究揭示了大语言模型易出错且难以识别自身错误的问题,再次引发外界对AI搜索工具可靠性的关注。
原文链接
本文链接:https://kx.umi6.com/article/15408.html
转载请注明文章出处
相关推荐
.png)
换一换
准确率可达 70%,科学家利用 AI 解读狗的叫声
2024-06-07 21:57:42
哥伦比亚大学研究:AI 搜索工具平均准确率仅六成,且自信满满“不认错”
2025-03-13 17:29:39
腾讯公布大语言模型训练专利 可提高模型准确性
2025-02-08 14:29:56
426 文章
80618 浏览
24小时热文
更多

-
2025-07-20 23:09:27
-
2025-07-20 22:09:17
-
2025-07-20 21:10:03