综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:2026年2月,11位顶尖数学家联合发布了一项名为First Proof的AI实验论文,引发广泛关注。该实验旨在测试当前AI系统能否独立解决10道未公开的研究级数学问题,覆盖代数组合学、谱图论等多个领域。这些问题由数学家从自身研究中提炼,避免了数据污染,并加密存储于特定网站,答案将于2月13日公开。实验显示,GPT 5.2 Pro和Gemini 3 Deepthink等顶级AI在一次性作答中难以解决多数问题,但作者认为通过人机协作可能提升表现。陶哲轩评价称,实验探索了AI在数学研究中的能力边界,未来还将设计更复杂的问题集,逐步评估AI在提出新问题和构建理论框架等高阶能力上的表现。
原文链接
加载更多
暂无内容