OpenAI 研究人员宣称已破解模型“幻觉”难题：现有评估方式在鼓励 AI“瞎蒙”

2025-09-06 16:36:08

数码游侠

发布在

快讯

阅读：1104

9月6日，OpenAI研究人员宣布破解大语言模型的“幻觉”难题，即模型输出不准确信息的问题。研究指出，幻觉源于训练方式偏向奖励猜测而非承认不确定性，导致模型倾向于‘装作知道’而非坦率表达未知。Claude模型因谨慎而减少错误，但高拒答率影响实用性。论文强调，现有评估标准促使模型成为‘考试型选手’，无法应对现实复杂性。解决方法在于重新设计评估体系，抑制乱猜行为，避免因拒答扣分。OpenAI呼吁更新基于准确率的评估方式，防止模型靠侥幸过关。

原文链接

本文链接：https://kx.umi6.com/article/24800.html

转载请注明文章出处

不确定性