标题:陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案
正文:
陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案
陶哲轩测试了o3-mini,称其能够重建图论中标准(专家级)结果的证明。他评价道:“o3-mini完全可以应对三角形移除引理的证明。”

三角形移除引理由Ruzsa和Szemeredi于1978年提出,核心内容是:对于任意的η>0,存在c>0,使得对于足够大的n个顶点的图,若最多包含cn³个三角形,则可通过移除最多ηn²条边使其无三角形。
陶哲轩测试后表示,在几秒钟内,o3-mini给出了完美的答案,准确解释了这种蕴含关系。

o3-mini如何作答?
陶哲轩的Prompt是关于三角形移除引理及其推论。o3-mini清晰地回答了如何从引理推导出结论。

随后,陶哲轩进一步提问,询问o3-mini能否解释(6,3)定理。o3-mini详细解释了这一推论的逻辑。

陶哲轩继续挑战,要求o3-mini针对线性情况给出更详细的论证。经过深入思考,o3-mini通过构造辅助图G,成功证明了线性情况下的(6,3)定理。

陶哲轩认可了这一证明,并询问如何将线性情况推广到一般情况。o3-mini提出了“清理”策略,通过删除少量超边使子超图线性化,进而应用线性情况的结论。
尽管如此,陶哲轩认为当前模型更适合处理标准问题,而非冷门问题。他还提到LLM的推理能力存在局限,依赖点赞/踩票信号而非逻辑推理。

陶哲轩与o3-mini的完整对话:
https://chatgpt.com/share/67cf13cf-53dc-800e-a382-e4ece8341a6d
参考链接:
https://mathstodon.xyz/@tao/114139145175476223
原文链接
本文链接:https://kx.umi6.com/article/15223.html
转载请注明文章出处
相关推荐
换一换
OpenAI 布罗克曼:GPT-5.2 Pro 再次破解公开数学难题,获陶哲轩认可
2026-01-18 13:18:51
OpenAI上架推理模型o3-mini 首次向免费用户开放推理功能
2025-02-01 05:13:09
陶哲轩用GPT5-Pro跨界挑战!3年无解的难题,11分钟出完整证明
2025-10-11 12:27:24
OpenAI 阿尔特曼:DeepSeek-R1 令人印象深刻,将推出更好的模型
2025-01-28 13:47:03
陶哲轩提前实测满血版o1:能当研究生使唤
2024-09-16 02:38:57
陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明
2025-05-12 14:33:30
陶哲轩提前实测满血版 OpenAI o1:能当研究生使唤
2024-09-16 19:30:48
OpenAI 升级 o3-mini 模型思维链,提高 AI 推理透明度
2025-02-07 07:46:38
扒一扒o3-mini背后团队:3位华人核心成员,北大清华南开校友在列
2024-12-23 13:53:27
陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议
2025-06-21 13:09:58
OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek
2025-02-07 12:52:23
45年数论猜想被GPT-5.2 Pro独立完成证明,陶哲轩:没犯任何错误
2026-01-19 17:02:53
陶哲轩亲测谷歌 Gemini 3:十分钟搞定百年数学难题
2025-11-23 23:27:24
665 文章
473500 浏览
24小时热文
更多
-
2026-03-10 13:19:24 -
2026-03-10 13:18:55 -
2026-03-10 12:13:43