OpenAI新模型达博士水平？我们找清北博士品鉴了一下

2024-09-16 00:47:37

发布在

科普

阅读：252

OpenAI发布了名为OepnAIo1模型的新产品，声称这是其至今最强、一致性最佳的模型。与以往不同的是，OpenAI并未过度宣传，仅以几张图表展现其实力。图表显示，OepnAIo1在国际数学奥林匹克竞赛、编程竞赛以及博士级别科学问题上，相对于GPT-4o模型，实现了接近8倍的提升。在各种学科及领域，OepnAIo1几乎全面超越了GPT-4o。

用户反馈极为积极，认为OepnAIo1“简直太棒了”，“最接近人类推理的东西”。甚至有用户直呼“新神已现”。然而，面对博士级别的测试，OepnAIo1的表现令人印象深刻，答题分数普遍高于博士专家，展现出在学术领域的出色理解力。

为了验证OpenAI的说法，文章邀请了南京大学在读的固体物理学崔博士等三位博士进行亲测。结果显示，OepnAIo1在物理方面表现出色，与GPT-4o相比提升了约20分，达到60~80分的水平，部分回答甚至可给90分。在材料化学领域，OepnAIo1的解答虽然在深入认知和方案提出上略显不足，但相较于之前的模型，理解能力显著提升，且编造内容更加贴近实际。

在生物领域，清华大学在读生物学博士信博士对OepnAIo1的回答表示认可，尽管模型在文献引用上存在虚构问题，但整体理解能力的提升是显而易见的。

OepnAIo1通过引入“长思维链”（CoT）概念，改进了传统问答模式，使得AI在解决问题时能够构建逻辑、进行推理论证，从而展现出更高级的认知能力。然而，即便如此，AI在创造性和某些特定领域仍无法替代人类博士专家。

OpenAI的研究人员Noam Brown透露，未来版本的OepnAIo1将具备长时间思考的能力，这虽增加了成本，但对于诸如开发抗癌药物等复杂任务而言，这种投入是值得的。此外，OepnAIo1实现的思维链模式，可能引领全球大模型的发展趋势。尽管距离通用人工智能（AGI）仍有距离，但技术进步的步伐正在加快，未来充满期待。

原文链接

本文链接：https://kx.umi6.com/article/6372.html

转载请注明文章出处

OepnAIo1模型