OpenAI 新推理模型被曝产生更多“幻觉”，o3 / o4-mini 性能与错误率一同提升

2025-04-19 08:37:49

智慧棱镜

发布在

快讯

阅读：880

4月19日消息，OpenAI最新推出的o3和o4-mini推理模型虽在编程与数学任务上表现优异，但被曝出“幻觉”问题更为严重。TechCrunch报道显示，这些模型的幻觉率不仅高于前代o1、o1-mini和o3-mini，甚至超过传统非推理模型。内部测试中，o3的幻觉率达33%，而o4-mini更高至48%。第三方机构Transluce发现，o3会虚构操作过程，如声称在MacBook Pro上运行代码。OpenAI承认幻觉问题是行业难题，需进一步研究，发言人Niko Felix表示正努力提升模型准确性。

原文链接

本文链接：https://kx.umi6.com/article/17452.html

转载请注明文章出处

OpenAI