11月19日,谷歌Gemini 3 Pro模型首秀引发关注。开发者测试显示,该模型仅需一条指令即可生成复杂3D乐高编辑器和完整手机游戏,如经典游戏《Ridiculous Fishing》的复刻版,包含音效与音乐。Gemini 3 Pro在多项基准测试中表现优异,以1501 Elo登顶LMArena排行榜,并在GPQA Diamond等测试中取得超91%的准确率。此外,在MMMU-Pro和Video-MMMU测试中分别获得81%和87.6%的高分,同时SimpleQA Verified测试得分为72.1%,展现其在科学与数学领域的可靠性。不过,与Anthropic的Claude Code相比,Gemini 3 Pro在多步骤指令遵循度上稍显不足。
原文链接
本文链接:https://kx.umi6.com/article/28801.html
转载请注明文章出处
相关推荐
换一换
谷歌 Gemini 3 Pro 首秀:仅用一条指令,AI 生成完整 3D 游戏
2025-11-20 13:25:27
蚂蚁集团开源全球首个万亿参数推理大模型 Ring-1T-preview,代码生成能力超 GPT-5
2025-09-30 11:26:40
Deepseek AI 模型升级推出 2.5 版:合并 Coder 和 Chat,对齐人类偏好、优化写作任务和指令跟随等
2024-09-06 09:51:39
中兴星云研发大模型通过备案:支持需求、设计、编程、测试等不同阶段 30 多种场景
2024-08-05 16:35:32
人力资源社会保障部部长:正研究措施发挥人工智能创造新岗位和赋能传统岗位作用
2026-03-07 11:27:41
美国拟将AI芯片出口管制扩展至全球 英伟达、AMD等公司出口需获许可
2026-03-06 06:31:53
黄仁勋:AI智能体将彻底改造软件 笨软件即将消失
2026-03-08 14:08:18
郑栅洁:从未来发展考虑 将推进人工智能超大规模智算集群、卫星互联网、可控核聚变等一系列重大工程和项目
2026-03-06 17:23:58
看完背后冷汗流!研究:先拥抱AI的行业或许会先被AI吃掉
2026-03-07 08:16:24
无垠拓界 基筑未来|无问智科重磅发布业界首个物理AI数据基座平台
2026-03-06 15:07:52
“办事”成全球AI新焦点:谷歌OpenAI相继投入 千问再加码
2026-03-06 18:25:27
科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude
2026-03-09 12:34:15
软银据悉寻求最高400亿美元贷款 用于投资OpenAI
2026-03-06 13:02:04
653 文章
484847 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18