近日,OpenAI发布了两款新模型o3和o4-mini,号称“迄今为止最强模型”。实测显示,o3在解决复杂推理问题时表现出色,如在EnigmaEva测试中拿下SOTA成绩。尤其在欧拉问题上,o4-mini仅用2分55秒便成功解答,超越了99%的人类表现。此外,o3首次实现上传图像到思维链功能,不仅能精准定位照片拍摄时间和地点,还能自动放大模糊细节。在编程能力上,o3 High击败谷歌Gemini-2.5,成为编程榜首,并开源了Codex CLI工具。然而,也有研究指出,o系列模型存在容易编造使用代码工具的行为,可能源于模型幻觉及奖励黑客攻击等问题。目前,ChatGPT Plus、Pro及Team用户已可抢先体验这些新模型,而旧版本o1、o3-mini等已下架。
原文链接
本文链接:https://kx.umi6.com/article/17338.html
转载请注明文章出处
相关推荐
换一换
OpenAI合作项目驱动对AI领军企业多年期业绩预期的上调
2025-12-15 21:00:57
奥尔特曼 400 万年薪急招“末日主管”!上岗即“地狱模式”
2025-12-29 15:34:55
OpenAI:我们的工具能让员工每天节省最多一小时专业工作时间
2025-12-08 21:49:12
GPT-5.2 提前泄露?线索显示其已“超越 Gemini 3”
2025-12-11 16:00:08
OpenAI 首席财务官:过去三年,公司收入、算力均累计增长约十倍
2026-01-19 16:03:05
OpenAI 上线富文本编辑,让你像用 Word 一样处理 ChatGPT 生成内容
2025-12-26 11:34:24
迪士尼 CEO 鲍勃・艾格谈为何投资 OpenAI:若不拥抱技术,我们将变得被动
2025-12-12 16:59:37
OpenAI ChatGPT 被曝开辟求职新赛道:AI 打磨简历、规划职业路径等
2026-01-10 09:02:04
姚班传奇陈立杰入职OpenAI!16岁保送清华,30岁拿下UC伯克利助理教授
2026-01-15 15:40:32
ChatGPT强行上马广告,因为OpenAI真的很烧钱
2026-01-19 16:01:57
软银集团完成对OpenAI的投资承诺
2025-12-31 09:09:06
“红色警报”奏效吗 OpenAI称霸企业级AI市场 碾压谷歌
2026-01-16 19:53:11
谷歌 Gemini 3 反击战:OpenAI GPT-5.2 被曝提前至下周发布,从新功能转向速度与稳定性提升
2025-12-06 09:19:14
653 文章
430577 浏览
24小时热文
更多
-
2026-01-23 12:56:24 -
2026-01-23 11:53:08 -
2026-01-23 11:52:03