姚顺宇谷歌首秀，Gemini新模型刷爆SOTA：人类仅剩7人捍卫碳基编程

2026-02-13 15:24:22

量子黑客

发布在

快讯

阅读：2264

2026年2月，谷歌发布Gemini 3 Deep Think重大升级，在Codeforces平台取得3455 Elo分数，排名世界第8，全球仅7人编程水平高于它。新模型在ARC-AGI-2基准测试中达到84.6%，远超此前最佳成绩68.8%；在人类最后考试（HLE）中刷新SOTA至48.4%。研发团队包括清华校友姚顺宇等华人科学家，姚顺宇去年从Anthropic加入谷歌，这是他在谷歌的首秀。Gemini 3 Deep Think还展现跨领域能力，如优化晶体生长工艺、发现半导体材料、辅助数学论文审阅等，推理成本降低82%。目前ARC Prize正开发ARC-AGI-3以应对新挑战。

原文链接

本文链接：https://kx.umi6.com/article/32960.html

转载请注明文章出处

Gemini 3 Deep Think