4月19日消息,OpenAI最新推出的o3和o4-mini推理模型虽在编程与数学任务上表现优异,但被曝出“幻觉”问题更为严重。TechCrunch报道显示,这些模型的幻觉率不仅高于前代o1、o1-mini和o3-mini,甚至超过传统非推理模型。内部测试中,o3的幻觉率达33%,而o4-mini更高至48%。第三方机构Transluce发现,o3会虚构操作过程,如声称在MacBook Pro上运行代码。OpenAI承认幻觉问题是行业难题,需进一步研究,发言人Niko Felix表示正努力提升模型准确性。
原文链接
本文链接:https://kx.umi6.com/article/17452.html
转载请注明文章出处
相关推荐
换一换
OpenAI最新融资1100亿美元!英伟达亚马逊软银都抢到船票了
2026-02-28 12:08:27
马斯克与OpenAI的恩怨情仇
2026-01-23 22:18:50
OpenAI关停Sora!25个月从封神到退场
2026-03-25 09:11:16
消息称三星将向OpenAI供应HBM4芯片 用于后者首款自研AI处理器
2026-03-19 21:37:07
黄仁勋反悔,不投千亿美元给OpenAI了?
2026-02-03 02:13:44
Anthropic遭遇OpenAI贴身肉搏,上市路多了个坎
2026-01-31 12:30:58
OpenAI称将ChatGPT引入美国国防部通用人工智能平台
2026-02-10 15:22:03
OpenAI首席信息安全官宣布将离职
2026-01-27 14:22:25
OpenAI试水广告业务 定价对标高端资源
2026-01-26 23:41:21
截至上月末 OpenAI年化收入突破250亿美元
2026-03-05 12:14:25
全球算力产业,正在陪着OpenAI走钢丝
2026-01-22 13:55:20
OpenAI 回应 ChatGPT 出现广告:平台 95% 是免费用户,会坚守一些原则
2026-01-21 13:13:21
OpenAI战略大转舵 全速冲刺ChatGPT商业化
2026-02-03 13:39:40
740 文章
559137 浏览
24小时热文
更多
-
2026-04-24 16:22:09 -
2026-04-24 16:21:03 -
2026-04-24 16:19:57