1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月19日消息,OpenAI最新推出的o3和o4-mini推理模型虽在编程与数学任务上表现优异,但被曝出“幻觉”问题更为严重。TechCrunch报道显示,这些模型的幻觉率不仅高于前代o1、o1-mini和o3-mini,甚至超过传统非推理模型。内部测试中,o3的幻觉率达33%,而o4-mini更高至48%。第三方机构Transluce发现,o3会虚构操作过程,如声称在MacBook Pro上运行代码。OpenAI承认幻觉问题是行业难题,需进一步研究,发言人Niko Felix表示正努力提升模型准确性。

原文链接
本文链接:https://kx.umi6.com/article/17452.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
巨额采购订单不断,OpenAI“停不下来”
2025-10-14 10:15:04
OpenAI 招募逾百名前投行人士训练 AI,目标干掉初级银行从业者的重复活
2025-10-22 10:45:33
AMD与OpenAI达成重磅合作:股价暴涨24% 市值增加4500亿
2025-10-07 13:54:13
软银为进一步投资OpenAI做准备:拟借款50亿美元充实资金储备
2025-10-11 10:34:20
满屏 AI 换脸,OpenAI 新应用 Sora 遭自家研究员吐槽
2025-10-02 11:08:52
OpenAI“星际之门”拉美首站:将在阿根廷建设 500MW 规模 AI 数据中心
2025-10-13 12:57:05
美国法官终止争议性命令:OpenAI 无需无限期保存 ChatGPT 聊天记录
2025-10-12 10:41:09
日本政府要求 OpenAI 不得通过 Sora 2 等实施任何可能侵犯版权的行为
2025-10-13 08:54:25
另有其人:OpenAI 并非博通 100 亿美元 AI 大单神秘客户
2025-10-14 13:16:37
OpenAI 启动 Codex Alpha 计划,将邀用户体验前沿 AI 编程模型
2025-10-06 11:35:29
微软 Azure 推出业界首个生产级英伟达 GB300 NVL72 大型集群,顾客为 OpenAI
2025-10-11 10:01:36
OpenAI 卖货做视频,Anthropic 专心写代码,谁能赢?
2025-10-02 12:13:09
OpenAI有花不完的钱?AI泡沫让人想起了当年的网络股
2025-10-15 08:31:01
24小时热文
更多
扫一扫体验小程序