1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案

正文:

陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案

陶哲轩测试了o3-mini,称其能够重建图论中标准(专家级)结果的证明。他评价道:“o3-mini完全可以应对三角形移除引理的证明。”

三角形移除引理由Ruzsa和Szemeredi于1978年提出,核心内容是:对于任意的η>0,存在c>0,使得对于足够大的n个顶点的图,若最多包含cn³个三角形,则可通过移除最多ηn²条边使其无三角形。

陶哲轩测试后表示,在几秒钟内,o3-mini给出了完美的答案,准确解释了这种蕴含关系。

o3-mini如何作答?

陶哲轩的Prompt是关于三角形移除引理及其推论。o3-mini清晰地回答了如何从引理推导出结论。

随后,陶哲轩进一步提问,询问o3-mini能否解释(6,3)定理。o3-mini详细解释了这一推论的逻辑。

陶哲轩继续挑战,要求o3-mini针对线性情况给出更详细的论证。经过深入思考,o3-mini通过构造辅助图G,成功证明了线性情况下的(6,3)定理。

陶哲轩认可了这一证明,并询问如何将线性情况推广到一般情况。o3-mini提出了“清理”策略,通过删除少量超边使子超图线性化,进而应用线性情况的结论。

尽管如此,陶哲轩认为当前模型更适合处理标准问题,而非冷门问题。他还提到LLM的推理能力存在局限,依赖点赞/踩票信号而非逻辑推理。

陶哲轩与o3-mini的完整对话:
https://chatgpt.com/share/67cf13cf-53dc-800e-a382-e4ece8341a6d

参考链接:
https://mathstodon.xyz/@tao/114139145175476223

原文链接
本文链接:https://kx.umi6.com/article/15223.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-5又帮陶哲轩解决了一个难题
2025-09-03 15:46:53
Altman因DeepSeek“认错”:在开源上OpenAI站在了历史的错误一方
2025-02-01 12:20:36
陶哲轩力推AlphaEvolve:解决67个不同数学问题,多个难题中超越人类最优解
2025-11-07 18:00:51
OpenAI达IMO金牌水平 数学家陶哲轩回应
2025-07-21 17:25:05
半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了
2025-12-13 23:13:03
OpenAI 阿尔特曼:ChatGPT 用户可免费体验 o3-mini,付费用户将获得更多额度
2025-01-24 13:41:27
啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
2025-09-14 13:38:51
OpenAI 小钢炮 o3-mini 推理模型登场:性能提升 24%,首次向免费 ChatGPT AI 用户开放
2025-02-01 08:15:29
谷歌 AI 系统 AlphaEvolve 获陶哲轩团队认可:使大规模数学研究成为可能
2025-11-19 17:28:31
陶哲轩油管首秀:33分钟,AI速证「人类需要写满一页纸」的证明
2025-05-12 14:33:30
陶哲轩提前实测满血版 OpenAI o1:能当研究生使唤
2024-09-16 19:30:48
OpenAI 紧急发布 o3-mini,CEO 阿尔特曼罕见认错并称 DeepSeek“非常好”
2025-02-01 14:22:55
OpenAI 布罗克曼:GPT-5.2 Pro 再次破解公开数学难题,获陶哲轩认可
2026-01-18 13:18:51
24小时热文
更多
扫一扫体验小程序