陶哲轩,著名数学家,早在8月便试用了OpenAI o1的完整版,远早于公众。他在测试中发现,该模型能够成功识别克莱姆定理,并给出“完全令人满意的”答案,相较于之前的模型,整体性能提升明显,但在细节处理和创新方面仍有限。陶哲轩形象地将模型比喻为“平庸但有小能力的研究生”,指出若提供额外资源如代数软件,模型性能可显著增强。此次测试在HackerNews等平台引发热议。此外,陶哲轩通过三轮测试对比了ChatGPT与o1,显示后者在理解和解决问题时更为条理化,且能够找到合适的数学定理解决复杂问题。在数学研究层面,大模型的应用已渐趋日常化,如用户wenc分享,借助大模型能高效生成MIP公式,节省大量研究时间。陶哲轩表示,未来大模型在数学领域的应用有望更加广泛,但强调其价值取决于用户对提示词的运用技巧,而非模型本身。
原文链接
本文链接:https://kx.umi6.com/article/6399.html
转载请注明文章出处
相关推荐
换一换
45年数论猜想被GPT-5.2 Pro独立完成证明,陶哲轩:没犯任何错误
2026-01-19 17:02:53
o1基石论文火爆传阅,Ilya仍是关键先生!核心项目清北校友闪光
2024-09-17 14:42:20
陶哲轩经费被断供,在线发帖自证数学有用
2025-08-05 13:13:15
OpenAI达IMO金牌水平 数学家陶哲轩回应
2025-07-21 17:25:05
GPT-5又帮陶哲轩解决了一个难题
2025-09-03 15:46:53
半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了
2025-12-13 23:13:03
陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案
2025-03-11 14:35:50
陶哲轩提前实测满血版o1:能当研究生使唤
2024-09-16 02:38:57
一文看懂OpenAI最强模型o1:怎么用好,为何翻车?
2024-09-20 18:22:13
OpenAI o1开辟“慢思考”,国产AI早已集结在CoE“组团”先出发
2024-09-19 15:33:35
陶哲轩用GPT5-Pro跨界挑战!3年无解的难题,11分钟出完整证明
2025-10-11 12:27:24
OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜:数学能力碾压 Claude 和谷歌 Gemini 模型,o1-mini 并列第一
2024-09-20 14:20:11
“编程作为一个职业在今日终结”,OpenAI新模型o1的可怕之处
2024-09-15 13:08:47
646 文章
457599 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18