4月19日消息,OpenAI最新推出的o3和o4-mini推理模型虽在编程与数学任务上表现优异,但被曝出“幻觉”问题更为严重。TechCrunch报道显示,这些模型的幻觉率不仅高于前代o1、o1-mini和o3-mini,甚至超过传统非推理模型。内部测试中,o3的幻觉率达33%,而o4-mini更高至48%。第三方机构Transluce发现,o3会虚构操作过程,如声称在MacBook Pro上运行代码。OpenAI承认幻觉问题是行业难题,需进一步研究,发言人Niko Felix表示正努力提升模型准确性。
原文链接
本文链接:https://kx.umi6.com/article/17452.html
转载请注明文章出处
相关推荐
换一换
OpenAI:《纽约时报》要求公司交出 ChatGPT 用户聊天记录,已要求法院驳回
2025-11-12 23:31:20
OpenAI与Target携手 将新的AI驱动体验带入零售领域
2025-11-19 19:35:24
ChatGPT 诞生三年,OpenAI 还未取得绝对领先
2025-12-04 12:18:49
AI要来卖东西了!代码曝光ChatGPT将加入广告内容
2025-12-01 15:14:18
微软与 OpenAI 账本曝光,AI 巨头们的“分钱”游戏
2025-11-15 15:54:19
孙正义再次清仓英伟达!上一次教训“价值2500亿美元”
2025-11-12 17:13:01
OpenAI和NextDC计划斥资46亿美元在澳大利亚悉尼建设数据中心
2025-12-05 11:28:34
OpenAI最快将于下周二发布GPT-5.2
2025-12-06 07:18:55
OpenAI:我们的工具能让员工每天节省最多一小时专业工作时间
2025-12-08 21:49:12
Transformer作者爆料GPT-5.1内幕!OpenAI内部命名规则变乱了
2025-11-30 14:13:24
OpenAI首席财务官:无上市计划 市场对AI泡沫担忧被夸大
2025-11-07 08:39:17
微软成立MAI超级智能团队:推进AI自主化摆脱对OpenAI依赖
2025-11-07 18:03:07
AI的两种“玩法”:三年后OpenAI还在烧钱 Anthropic将开始赚钱?
2025-11-11 15:11:53
609 文章
339491 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57