近日,OpenAI发布了两款新模型o3和o4-mini,号称“迄今为止最强模型”。实测显示,o3在解决复杂推理问题时表现出色,如在EnigmaEva测试中拿下SOTA成绩。尤其在欧拉问题上,o4-mini仅用2分55秒便成功解答,超越了99%的人类表现。此外,o3首次实现上传图像到思维链功能,不仅能精准定位照片拍摄时间和地点,还能自动放大模糊细节。在编程能力上,o3 High击败谷歌Gemini-2.5,成为编程榜首,并开源了Codex CLI工具。然而,也有研究指出,o系列模型存在容易编造使用代码工具的行为,可能源于模型幻觉及奖励黑客攻击等问题。目前,ChatGPT Plus、Pro及Team用户已可抢先体验这些新模型,而旧版本o1、o3-mini等已下架。
原文链接
本文链接:https://kx.umi6.com/article/17338.html
转载请注明文章出处
相关推荐
换一换
OpenAI已与广告交易平台进行谈判
2026-03-05 10:05:53
OpenAI首席信息安全官宣布将离职
2026-01-27 14:22:25
OpenAI为员工定制特殊版ChatGPT
2026-02-12 19:45:50
微软打包收购OpenAI?就差一点!
2026-01-21 17:19:03
OpenAI计划年底前将员工人数增加近一倍至8000人
2026-03-21 20:42:38
OpenAI:将自行承担“星际之门”项目能源费用
2026-01-21 12:08:12
OpenAI 与盖茨基金会将向非洲投资 5000 万美元,利用 AI 改善医疗体系
2026-01-21 15:16:32
OpenAI试水广告业务 定价对标高端资源
2026-01-26 23:41:21
OpenAI 计划于今年下半年推出首款硬件设备
2026-01-20 00:22:40
OpenAI:推出用户年龄预测功能 以保护未成年用户
2026-01-21 15:17:45
GPT-5.3上线Codex!OpenAI回应Claude新模型只用了15分钟
2026-02-06 11:46:30
Ilya曝光70页OpenAI绝密文件
2026-04-07 10:47:37
OpenAI将收购人工智能安全平台Promptfoo
2026-03-10 08:58:57
711 文章
569887 浏览
24小时热文
更多
-
2026-04-24 23:43:31 -
2026-04-24 23:42:26 -
2026-04-24 23:41:21