标题:陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案
正文:
陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案
陶哲轩测试了o3-mini,称其能够重建图论中标准(专家级)结果的证明。他评价道:“o3-mini完全可以应对三角形移除引理的证明。”

三角形移除引理由Ruzsa和Szemeredi于1978年提出,核心内容是:对于任意的η>0,存在c>0,使得对于足够大的n个顶点的图,若最多包含cn³个三角形,则可通过移除最多ηn²条边使其无三角形。
陶哲轩测试后表示,在几秒钟内,o3-mini给出了完美的答案,准确解释了这种蕴含关系。

o3-mini如何作答?
陶哲轩的Prompt是关于三角形移除引理及其推论。o3-mini清晰地回答了如何从引理推导出结论。

随后,陶哲轩进一步提问,询问o3-mini能否解释(6,3)定理。o3-mini详细解释了这一推论的逻辑。

陶哲轩继续挑战,要求o3-mini针对线性情况给出更详细的论证。经过深入思考,o3-mini通过构造辅助图G,成功证明了线性情况下的(6,3)定理。

陶哲轩认可了这一证明,并询问如何将线性情况推广到一般情况。o3-mini提出了“清理”策略,通过删除少量超边使子超图线性化,进而应用线性情况的结论。
尽管如此,陶哲轩认为当前模型更适合处理标准问题,而非冷门问题。他还提到LLM的推理能力存在局限,依赖点赞/踩票信号而非逻辑推理。

陶哲轩与o3-mini的完整对话:
https://chatgpt.com/share/67cf13cf-53dc-800e-a382-e4ece8341a6d
参考链接:
https://mathstodon.xyz/@tao/114139145175476223
原文链接
本文链接:https://kx.umi6.com/article/15223.html
转载请注明文章出处
相关推荐
换一换
陶哲轩用GPT-5解决数学难题:仅29行Python代码
2025-10-04 12:59:43
Altman因DeepSeek“认错”:在开源上OpenAI站在了历史的错误一方
2025-02-01 12:20:36
OpenAI达IMO金牌水平 数学家陶哲轩回应
2025-07-21 17:25:05
首个OpenAI免费推理模型o3-mini发布!DeepSeek让奥特曼反思:不开源我们错了
2025-02-01 13:20:46
陶哲轩宣布“等式理论计划”成功,57天完成2200万+数学关系证明
2024-11-23 13:25:09
陶哲轩对谈OpenAI高管,“也许很快OpenAI就能证明陶哲轩是错的”
2024-12-08 13:04:03
OpenAI 紧急发布 o3-mini,CEO 阿尔特曼罕见认错并称 DeepSeek“非常好”
2025-02-01 14:22:55
和GPT聊了21天,我差点成为陶哲轩
2025-08-14 16:57:30
GPT-5又帮陶哲轩解决了一个难题
2025-09-03 15:46:53
OpenAI 阿尔特曼:DeepSeek-R1 令人印象深刻,将推出更好的模型
2025-01-28 13:47:03
OpenAI深夜反击DeepSeek,紧急上线o3-mini免费用
2025-02-01 08:16:34
o3-mini碾压DeepSeek R1?一条python程序引发近400万围观
2025-02-03 09:05:18
OpenAI 升级 o3-mini 模型思维链,提高 AI 推理透明度
2025-02-07 07:46:38
546 文章
272258 浏览
24小时热文
更多
-
2025-10-26 21:29:49 -
2025-10-26 21:28:42 -
2025-10-26 20:27:28