3月26日,谷歌推出的Gemini 2.5 Pro在多个榜单上表现出色,尤其是在Chatbot Arena中领先第二名39分。这款推理模型具备强大的上下文理解能力,支持100万token窗口,即将扩展至200万。Gemini 2.5 Pro能处理文本、音频、图像、视频等多种数据形式,在创意写作、指令遵循、长查询及视觉竞技场中均获冠军,同时在网页开发竞技场排名第二。此外,它在数学和科学基准测试中也表现优异,特别是在‘人类的最后考试(无工具)’中取得18.8%的成绩,远超其他LLMs。Gemini 2.5 Pro已向Gemini Advanced用户开放,并计划在Vertex AI上推出,未来几周将公布定价方案。
原文链接
本文链接:https://kx.umi6.com/article/16198.html
转载请注明文章出处
相关推荐
换一换
国产AI搜索接入DeepSeek-R1!我们深度试玩了一下
2025-02-03 10:06:40
“起大早赶晚集”的谷歌大模型,这次真的“遥遥领先”了?
2025-03-26 20:07:52
OpenAI o1 模型登场:开启 AI 通用复杂推理新篇章,模拟人类思考、处理问题
2024-09-13 08:08:03
DeepSeek 团队新作:把代码变成思维链,大模型推理各种能力全面提升
2025-02-17 15:53:30
黄仁勋自曝每天使用ChatGPT!相信它会越来越强
2024-10-11 12:06:04
谷歌 DeepMind 优化 AI 模型新思路,计算效率与推理能力兼得
2024-12-28 10:24:13
Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7
2025-05-07 17:12:34
谷歌推 I/O 版 Gemini 2.5 Pro 模型,AI 助力前端开发与复杂编程
2025-05-07 14:09:50
马斯克发布Grok 3,推理能力超o3和DeepSeek-R1
2025-02-18 15:28:47
仅用提示词工程摘下IMO金牌!清华校友强强联手新发现,学术界不靠砸钱也能比肩大厂
2025-08-02 14:17:45
DeepSeek-R1-0528 更新官方详解:思考更深、推理更强,整体表现接近 o3
2025-05-29 20:40:27
苹果最新研究:现有 AI 大模型“更像是在记忆,而非真正的推理”
2025-06-08 17:10:55
RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理
2025-04-23 11:57:26
678 文章
468272 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18