
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
数学题干带猫,AI就“懵”了!错误率飙升3倍,DeepSeek、o1均中招
大模型的数学能力竟因猫猫“崩塌”?最新研究显示,只需在数学题后加一句“有趣的事实是,猫一生绝大多数时间都在睡觉”,模型答错概率立刻翻3倍。这一现象不仅影响推理模型如DeepSeek-R1和OpenAI o1,还导致答案更...
原文链接
哥伦比亚大学数字新闻研究中心近期研究发现,多款AI搜索工具在引用新闻内容时错误率高达60%,其中付费版本错误率更高。研究测试了包括ChatGPT Search、Perplexity等在内的8款AI搜索工具,结果显示AI常自信提供错误答案,且付费版更倾向于给出错误而非拒绝回答。研究指出,AI搜索工具常绕过机器人排除协议,编造链接或引用转载内容,导致出版商权益受损。此外,AI搜索工具引用的权威来源虽提升了可信度,但错误引用却损害了出版商声誉。即便有授权协议,准确引用仍存问题。这项研究揭示了AI搜索工具在新闻引用方面的普遍缺陷,引发对行业影响的担忧。
原文链接
哥伦比亚大学数字新闻研究中心近日研究发现,八款主流AI搜索引擎(ChatGPT Search、Perplexity、Gemini等)的平均准确率仅为六成,且对错误答案表现出过度自信。研究选取200篇来自20家新闻机构的报道进行测试,要求AI准确引用文章内容、来源及链接。结果显示,除Perplexit...
原文链接
普渡大学研究团队在5月初的计算机-人交互大会上揭示,ChatGPT对Stack Overflow编程问题的回答错误率惊人,达52%。尽管如此,令人惊讶的是,有39%的人类程序员未能察觉到错误答案,仅35%的程序员更倾向于ChatGPT的回答,认为其内容全面、语言清晰。这项研究暗示生成式AI尚存误诊问题,人类用户需保持警惕。【时效】5月5日计算机-人交互大会。#ChatGPT错误率52%#程序员警觉误区
原文链接
加载更多

暂无内容