标题:陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案
正文:
陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案
陶哲轩测试了o3-mini,称其能够重建图论中标准(专家级)结果的证明。他评价道:“o3-mini完全可以应对三角形移除引理的证明。”

三角形移除引理由Ruzsa和Szemeredi于1978年提出,核心内容是:对于任意的η>0,存在c>0,使得对于足够大的n个顶点的图,若最多包含cn³个三角形,则可通过移除最多ηn²条边使其无三角形。
陶哲轩测试后表示,在几秒钟内,o3-mini给出了完美的答案,准确解释了这种蕴含关系。

o3-mini如何作答?
陶哲轩的Prompt是关于三角形移除引理及其推论。o3-mini清晰地回答了如何从引理推导出结论。

随后,陶哲轩进一步提问,询问o3-mini能否解释(6,3)定理。o3-mini详细解释了这一推论的逻辑。

陶哲轩继续挑战,要求o3-mini针对线性情况给出更详细的论证。经过深入思考,o3-mini通过构造辅助图G,成功证明了线性情况下的(6,3)定理。

陶哲轩认可了这一证明,并询问如何将线性情况推广到一般情况。o3-mini提出了“清理”策略,通过删除少量超边使子超图线性化,进而应用线性情况的结论。
尽管如此,陶哲轩认为当前模型更适合处理标准问题,而非冷门问题。他还提到LLM的推理能力存在局限,依赖点赞/踩票信号而非逻辑推理。

陶哲轩与o3-mini的完整对话:
https://chatgpt.com/share/67cf13cf-53dc-800e-a382-e4ece8341a6d
参考链接:
https://mathstodon.xyz/@tao/114139145175476223
原文链接
本文链接:https://kx.umi6.com/article/15223.html
转载请注明文章出处
相关推荐
.png)
换一换
陶哲轩经费被断供,在线发帖自证数学有用
2025-08-05 13:13:15
OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek
2025-02-07 12:52:23
陶哲轩提前实测满血版 OpenAI o1:能当研究生使唤
2024-09-16 19:30:48
陶哲轩:纳维-斯托克斯方程或已不再是流体的良好模型
2024-10-20 19:00:01
OpenAI 阿尔特曼:ChatGPT 用户可免费体验 o3-mini,付费用户将获得更多额度
2025-01-24 13:41:27
OpenAI 升级 o3-mini 模型思维链,提高 AI 推理透明度
2025-02-07 07:46:38
哈佛反向学习法火了:教会 AI 就是教会自己,陶哲轩力荐
2024-09-02 13:46:02
陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明
2025-05-12 14:33:30
扒一扒o3-mini背后团队:3位华人核心成员,北大清华南开校友在列
2024-12-23 13:53:27
陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题
2025-05-20 16:41:45
OpenAI 紧急发布 o3-mini,CEO 阿尔特曼罕见认错并称 DeepSeek“非常好”
2025-02-01 14:22:55
陶哲轩宣布“等式理论计划”成功,人类AI协作57天
2024-11-24 09:42:11
OpenAI 小钢炮 o3-mini 推理模型登场:性能提升 24%,首次向免费 ChatGPT AI 用户开放
2025-02-01 08:15:29
497 文章
174917 浏览
24小时热文
更多

-
2025-09-11 17:05:26
-
2025-09-11 17:04:27
-
2025-09-11 17:03:19