陶哲轩,著名数学家,早在8月便试用了OpenAI o1的完整版,远早于公众。他在测试中发现,该模型能够成功识别克莱姆定理,并给出“完全令人满意的”答案,相较于之前的模型,整体性能提升明显,但在细节处理和创新方面仍有限。陶哲轩形象地将模型比喻为“平庸但有小能力的研究生”,指出若提供额外资源如代数软件,模型性能可显著增强。此次测试在HackerNews等平台引发热议。此外,陶哲轩通过三轮测试对比了ChatGPT与o1,显示后者在理解和解决问题时更为条理化,且能够找到合适的数学定理解决复杂问题。在数学研究层面,大模型的应用已渐趋日常化,如用户wenc分享,借助大模型能高效生成MIP公式,节省大量研究时间。陶哲轩表示,未来大模型在数学领域的应用有望更加广泛,但强调其价值取决于用户对提示词的运用技巧,而非模型本身。
原文链接
本文链接:https://kx.umi6.com/article/6399.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI最强模型o1,仍分不出“9.11和9.8哪个大”
2024-09-13 12:16:49
陶哲轩提前实测满血版 OpenAI o1:能当研究生使唤
2024-09-16 19:30:48
陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明
2025-05-12 14:33:30
431 文章
72217 浏览
24小时热文
更多

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13