2026年2月,谷歌发布Gemini 3 Deep Think重大升级,在Codeforces平台取得3455 Elo分数,排名世界第8,全球仅7人编程水平高于它。新模型在ARC-AGI-2基准测试中达到84.6%,远超此前最佳成绩68.8%;在人类最后考试(HLE)中刷新SOTA至48.4%。研发团队包括清华校友姚顺宇等华人科学家,姚顺宇去年从Anthropic加入谷歌,这是他在谷歌的首秀。Gemini 3 Deep Think还展现跨领域能力,如优化晶体生长工艺、发现半导体材料、辅助数学论文审阅等,推理成本降低82%。目前ARC Prize正开发ARC-AGI-3以应对新挑战。
原文链接
本文链接:https://kx.umi6.com/article/32960.html
转载请注明文章出处
相关推荐
换一换
纯蒸馏模型 SOTA 出现!直接 SFT 成本直降 50 倍,数据已全部开源
2025-05-22 11:30:40
谷歌最强大模型付费上线,在DeepSeek开源后被吐槽太贵
2025-12-05 14:31:30
开源Qwen一周连刷三冠,暴击闭源模型!基础模型推理编程均SOTA
2025-07-26 13:39:05
AI Coding新王登场!MiniMax M2.1拿下多语言编程SOTA
2025-12-24 10:26:59
另一位Yao Shunyu也跳槽了:与Anthropic价值观有根本分歧
2025-10-09 09:04:51
1/15成本,实现AI水印新SOTA | 南洋理工大学&A*STAR
2025-05-31 13:06:45
4090玩转大场景几何重建,RGB渲染和几何精度达SOTA|上海AI Lab&西工大新研究
2025-04-13 19:51:00
分割/识别/解说一个模型搞定!3B参数刷新视觉理解SOTA,图像视频全适配
2025-06-14 20:40:35
阶跃星辰发布端到端语音大模型 Step-Audio 2 mini,多个基准测试取得 SOTA 成绩
2025-09-01 15:21:09
悬赏800万的超难测试集,被GPT-4o实现新SOTA,准确率已达50%
2024-06-18 15:31:25
华人AI大神霸气离职:绝不接受反华
2025-10-11 10:27:25
华人AI大神霸气离职,一篇博客挑明中美大模型暗战
2025-10-11 10:14:30
达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩
2025-02-14 12:34:39
697 文章
601123 浏览
24小时热文
更多
-
2026-04-17 08:53:15 -
2026-04-17 08:52:08 -
2026-04-17 08:51:02