9月17日,Salesforce人工智能研究院发布研究显示,多款生成式AI工具的答案质量堪忧。研究测试了GPT-4.5、GPT-5、必应聊天、You.com及Perplexity等搜索引擎与深度研究工具,发现三分之一以上的答案缺乏可靠来源支持。例如,GPT-4.5的无依据主张比例达47%,而Perplexity深度研究工具更高达97.5%。研究人员使用微调语言模型评估303个查询请求,并提出‘DeepTrace’八项指标进行分析。尽管部分公司质疑研究方法,但专家指出,AI系统仍可能生成片面或误导性内容,需进一步提升准确性与可靠性,以应对广泛应用的挑战。
原文链接
本文链接:https://kx.umi6.com/article/25402.html
转载请注明文章出处
相关推荐
.png)
换一换
一文看懂AI竞赛:王座更替,谁家的AI更招财
2025-09-02 20:41:49
数据显示:日本企业AI使用率大幅落后中美
2025-07-16 19:15:29
阿里云将在韩国启用第二座数据中心 满足生成式AI需求
2025-06-19 10:50:10
亚马逊 2 月 26 日发布新一代 Alexa 生成式 AI 服务,使用 Claude 模型
2025-02-06 07:22:32
初级员工,生成式AI的第一批牺牲者?
2025-07-02 11:04:40
方正证券:数据+行业knowhow——算法——用户的闭环是AI应用走出差异化的关键
2025-01-07 14:11:40
云计算一哥的生成式AI之道:Choice Matters
2024-12-18 19:37:32
Canalys:预计2029年生成式AI市场规模达728亿美元
2024-12-11 16:38:47
《堡垒之夜》引入生成式 AI 工具,仅需 20 行文本就能定制智能 NPC
2025-06-04 13:18:58
AI大幅降本,扶起“半死不活”的动漫短剧
2025-05-03 18:39:28
《纽约时报》达成首份以生成式 AI 为重点内容许可协议,合作方为亚马逊
2025-06-04 11:19:41
百度生成式AI和大模型专利中国第一,全栈创新驱动AI应用领先
2025-07-18 16:41:37
IDC:到2028年中国安全智能体相关应用市场规模将达到16亿美元
2025-07-04 14:49:49
550 文章
183736 浏览
24小时热文
更多

-
2025-09-18 00:39:12
-
2025-09-17 23:39:58
-
2025-09-17 23:38:52