据《科创板日报》21日报道,OpenAI发现其最新推理模型o4在PersonQA测试中幻觉率较高。具体而言,o4有33%的问题回答出现幻觉,这一比例是之前模型o1和o3 mini的两倍;而o4 mini的表现更差,48%的问题存在幻觉现象。幻觉问题指AI生成的内容与事实不符或无根据。AI研究员Neil Chowdhury指出,o系列模型采用的强化学习可能加剧了这一问题。此情况引发关注,提示AI模型在优化过程中需平衡性能与准确性。
原文链接
本文链接:https://kx.umi6.com/article/17498.html
转载请注明文章出处
相关推荐
换一换
Eightco对OpenAI追加投资4000万美元
2026-03-20 21:05:44
马斯克爆出「权力暗桩」,奥特曼进入反击时刻?
2026-05-12 15:18:46
OpenAI三位高管同日离职
2026-04-21 00:33:46
OpenAI CEO发文感谢开发者引众怒!程序员痛斥:AI巨头对人类劳动用完即弃
2026-03-19 17:15:35
OpenAI推出Codex Labs
2026-04-21 22:30:39
降价50% OpenAI开打价格战:顶级套餐仅需100美元/月
2026-04-10 09:58:34
OpenAI正式发布GPT-5.5
2026-04-24 09:02:17
诺和诺德宣布与OpenAI建立战略合作伙伴关系
2026-04-14 15:05:51
刚被媒体曝黑料 豪宅又被人爆弹 OpenAI CEO回应:气得要命
2026-04-11 14:03:36
OpenAI推动伊利诺伊州先进AI免责立法
2026-04-10 17:22:59
更多银行参与软银的400亿美元银团贷款 助其投资OpenAI
2026-04-30 16:34:37
OpenAI的Codex登陆亚马逊Bedrock平台
2026-04-29 02:54:02
OpenAI开创“算力换股权”玩法:奥尔特曼向数百家YC创企发出邀约
2026-05-20 17:49:51
787 文章
659293 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41