1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2026年2月,谷歌发布Gemini 3 Deep Think重大升级,在Codeforces平台取得3455 Elo分数,排名世界第8,全球仅7人编程水平高于它。新模型在ARC-AGI-2基准测试中达到84.6%,远超此前最佳成绩68.8%;在人类最后考试(HLE)中刷新SOTA至48.4%。研发团队包括清华校友姚顺宇等华人科学家,姚顺宇去年从Anthropic加入谷歌,这是他在谷歌的首秀。Gemini 3 Deep Think还展现跨领域能力,如优化晶体生长工艺、发现半导体材料、辅助数学论文审阅等,推理成本降低82%。目前ARC Prize正开发ARC-AGI-3以应对新挑战。

原文链接
本文链接:https://kx.umi6.com/article/32960.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
4090玩转大场景几何重建,RGB渲染和几何精度达SOTA|上海AI Lab&西工大新研究
2025-04-13 19:51:00
开源Qwen一周连刷三冠,暴击闭源模型!基础模型推理编程均SOTA
2025-07-26 13:39:05
GPT-4o攻破ARC-AGI无法被挑战的神话,71%准确率成新SOTA
2024-06-20 14:13:43
达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩
2025-02-14 12:34:39
智元发布第二代一体化具身大小脑系统 GenieReasoner,推理能力达 SOTA
2026-01-01 18:27:20
月之暗面发布 Kimi k1.5 多模态思考模型,实现 SOTA 级多模态推理能力
2025-01-20 23:25:35
截胡 OpenAI:谷歌率先公测“奥数金牌级”推理 AI 模型 Gemini 3 Deep Think
2025-12-05 14:33:37
那个用半成品刷爆SOTA的Qwen3超大杯推理版,现在正式上线
2026-01-27 00:41:43
悬赏800万的超难测试集,被GPT-4o实现新SOTA,准确率已达50%
2024-06-18 15:31:25
Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型了
2024-10-28 16:55:02
腾讯混元 OCR 模型宣布开源:参数仅 1B,多项核心能力 SOTA
2025-11-25 14:56:08
AI Coding新王登场!MiniMax M2.1拿下多语言编程SOTA
2025-12-24 10:26:59
谷歌最强大模型付费上线,在DeepSeek开源后被吐槽太贵
2025-12-05 14:31:30
24小时热文
更多
扫一扫体验小程序