11月23日,谷歌Gemini 3在发布后迅速领跑各大基准测试。知名研究机构Epoch AI证实,Gemini 3 Pro在高级数学基准测试FrontierMath中创下新纪录:Tier 1-3准确率达38%,Tier 4达19%,并在综合能力指数(ECI)中以154分超越GPT-5.1的151分。更令人瞩目的是,数学家陶哲轩近日利用Gemini Deepthink模式仅用十分钟解决了百年数学难题埃尔德什问题#367的关键证明。此外,Gemini 3还在物理基准测试CritPt中表现优异,尽管得分为9.1%,但已代表当前AI模型最前沿水平。这一系列成果表明,AI正成为科学家高效协作的重要工具。
原文链接
本文链接:https://kx.umi6.com/article/28968.html
转载请注明文章出处
相关推荐
换一换
陶哲轩经费被断供,在线发帖自证数学有用
2025-08-05 13:13:15
GPT-5又帮陶哲轩解决了一个难题
2025-09-03 15:46:53
OpenAI 布罗克曼:GPT-5.2 Pro 再次破解公开数学难题,获陶哲轩认可
2026-01-18 13:18:51
陶哲轩亲测点赞o3-mini:专家级证明,我收到了一个完美的答案
2025-03-11 14:35:50
AI争霸格局突变?五大“东风”将谷歌送上王座!
2025-11-26 11:41:07
陶哲轩:我差点江郎才尽,只因在普林斯顿待了一年
2026-03-23 18:33:41
Gemini 3打服奥特曼马斯克,谷歌CEO却在担心AI泡沫
2025-11-19 14:17:44
SAIR年度峰会即将开幕,陶哲轩等顶尖科学家共议AI如何重塑科研未来
2026-01-30 13:25:02
陶哲轩提前实测满血版 OpenAI o1:能当研究生使唤
2024-09-16 19:30:48
陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议
2025-06-21 13:09:58
和GPT聊了21天,我差点成为陶哲轩
2025-08-14 16:57:30
狙击Gemini 3!OpenAI发布GPT-5.1-Codex-Max
2025-11-20 16:30:54
啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
2025-09-14 13:38:51
673 文章
543977 浏览
24小时热文
更多
-
2026-04-24 15:20:44 -
2026-04-24 15:19:39 -
2026-04-24 15:18:33