OpenAI发布了名为OepnAIo1模型的新产品,声称这是其至今最强、一致性最佳的模型。与以往不同的是,OpenAI并未过度宣传,仅以几张图表展现其实力。图表显示,OepnAIo1在国际数学奥林匹克竞赛、编程竞赛以及博士级别科学问题上,相对于GPT-4o模型,实现了接近8倍的提升。在各种学科及领域,OepnAIo1几乎全面超越了GPT-4o。
用户反馈极为积极,认为OepnAIo1“简直太棒了”,“最接近人类推理的东西”。甚至有用户直呼“新神已现”。然而,面对博士级别的测试,OepnAIo1的表现令人印象深刻,答题分数普遍高于博士专家,展现出在学术领域的出色理解力。
为了验证OpenAI的说法,文章邀请了南京大学在读的固体物理学崔博士等三位博士进行亲测。结果显示,OepnAIo1在物理方面表现出色,与GPT-4o相比提升了约20分,达到60~80分的水平,部分回答甚至可给90分。在材料化学领域,OepnAIo1的解答虽然在深入认知和方案提出上略显不足,但相较于之前的模型,理解能力显著提升,且编造内容更加贴近实际。
在生物领域,清华大学在读生物学博士信博士对OepnAIo1的回答表示认可,尽管模型在文献引用上存在虚构问题,但整体理解能力的提升是显而易见的。
OepnAIo1通过引入“长思维链”(CoT)概念,改进了传统问答模式,使得AI在解决问题时能够构建逻辑、进行推理论证,从而展现出更高级的认知能力。然而,即便如此,AI在创造性和某些特定领域仍无法替代人类博士专家。
OpenAI的研究人员Noam Brown透露,未来版本的OepnAIo1将具备长时间思考的能力,这虽增加了成本,但对于诸如开发抗癌药物等复杂任务而言,这种投入是值得的。此外,OepnAIo1实现的思维链模式,可能引领全球大模型的发展趋势。尽管距离通用人工智能(AGI)仍有距离,但技术进步的步伐正在加快,未来充满期待。
.png)

-
2025-07-20 22:09:17
-
2025-07-20 21:10:03
-
2025-07-20 21:09:03