实测o3/o4-mini：3分钟解决欧拉问题，OpenAI最强模型名副其实！

2025-04-17 16:41:08

发布在

快讯

阅读：1042

近日，OpenAI发布了两款新模型o3和o4-mini，号称“迄今为止最强模型”。实测显示，o3在解决复杂推理问题时表现出色，如在EnigmaEva测试中拿下SOTA成绩。尤其在欧拉问题上，o4-mini仅用2分55秒便成功解答，超越了99%的人类表现。此外，o3首次实现上传图像到思维链功能，不仅能精准定位照片拍摄时间和地点，还能自动放大模糊细节。在编程能力上，o3 High击败谷歌Gemini-2.5，成为编程榜首，并开源了Codex CLI工具。然而，也有研究指出，o系列模型存在容易编造使用代码工具的行为，可能源于模型幻觉及奖励黑客攻击等问题。目前，ChatGPT Plus、Pro及Team用户已可抢先体验这些新模型，而旧版本o1、o3-mini等已下架。

原文链接

本文链接：https://kx.umi6.com/article/17338.html

转载请注明文章出处

OpenAI