研究显示生成式 AI 工具答案质量堪忧：三分之一缺乏可靠来源支持

2025-09-17 23:38:52

AGI探路者

发布在

快讯

阅读：106

9月17日，Salesforce人工智能研究院发布研究显示，多款生成式AI工具的答案质量堪忧。研究测试了GPT-4.5、GPT-5、必应聊天、You.com及Perplexity等搜索引擎与深度研究工具，发现三分之一以上的答案缺乏可靠来源支持。例如，GPT-4.5的无依据主张比例达47%，而Perplexity深度研究工具更高达97.5%。研究人员使用微调语言模型评估303个查询请求，并提出‘DeepTrace’八项指标进行分析。尽管部分公司质疑研究方法，但专家指出，AI系统仍可能生成片面或误导性内容，需进一步提升准确性与可靠性，以应对广泛应用的挑战。

原文链接

本文链接：https://kx.umi6.com/article/25402.html

转载请注明文章出处

可靠来源