4月19日消息,OpenAI最新推出的o3和o4-mini推理模型虽在编程与数学任务上表现优异,但被曝出“幻觉”问题更为严重。TechCrunch报道显示,这些模型的幻觉率不仅高于前代o1、o1-mini和o3-mini,甚至超过传统非推理模型。内部测试中,o3的幻觉率达33%,而o4-mini更高至48%。第三方机构Transluce发现,o3会虚构操作过程,如声称在MacBook Pro上运行代码。OpenAI承认幻觉问题是行业难题,需进一步研究,发言人Niko Felix表示正努力提升模型准确性。
原文链接
本文链接:https://kx.umi6.com/article/17452.html
转载请注明文章出处
相关推荐
换一换
没博士没论文,这些人杀进AI大厂
2026-01-27 03:49:22
GPT-5.4发布:OpenAI首个大一统模型,简直是龙虾原生
2026-03-06 09:42:29
OpenAI已建立人形机器人实验室 启动以来规模扩大四倍多
2026-01-22 21:11:56
消息称 OpenAI 要求外包人员上传真实工作成果,律师警告称风险极高
2026-01-12 09:24:27
DeepMind CEO:对OpenAI引入广告感到惊讶 Gemini目前没这种计划
2026-01-23 15:00:51
OpenAI调整“星际之门”项目策略:暂缓自建 转向与甲骨文及软银深度合作
2026-02-24 13:54:26
14亿元留不住!庞若鸣弃Meta加盟OpenAI
2026-02-26 13:58:39
OpenAI下调算力支出目标至6000亿美元 推进新一轮巨额融资
2026-02-21 09:21:56
OpenAI推出Prism 可用于撰写论文和协作研究
2026-01-28 10:18:55
OpenAI前高管坦言公司“掉链子” 让竞争对手谷歌得以翻身
2026-01-24 00:23:19
OpenAI:将自行承担“星际之门”项目能源费用,确保不会推高电价
2026-01-21 13:12:22
OpenAI缩减ChatGPT内置购物功能规划
2026-03-05 10:06:59
马斯克与OpenAI的恩怨情仇
2026-01-23 22:18:50
698 文章
476586 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18