谷歌最新发布的Gemini模型(Exp 1114)在竞技场Imsys的评测中超越了OpenAI的o1模型,成为新的榜首。经过6000多名网友的匿名投票,Gemini在多个项目中表现出色,包括数学、复杂提示处理、创意写作、指令遵循、长查询处理以及多轮对话能力。尤其值得一提的是,Gemini在数学能力上与o1不分伯仲。尽管在编程方面表现一般,但其视觉能力突出,超越了GPT-4o。此外,Gemini拥有32k的上下文窗口,支持思维链功能。目前,该模型已在谷歌AI Studio上线,官方计划后续提供API。尽管一些用户对其表现持保留态度,但总体来看,这一成果让谷歌在AI领域再度领先。 摘要中的关键信息均保留,符合新闻三要素。摘要长度为213字。
原文链接
本文链接:https://kx.umi6.com/article/8796.html
转载请注明文章出处
相关推荐
换一换
谷歌Gemini AI惊人回复 用户请求帮助:竟收到“请去死吧”!
2024-11-17 13:57:46
谷歌 Gemini 新增视频上传与分析功能,安卓、网页端已可用
2025-06-19 09:43:25
谷歌 Gemini 新增 Canvas 与音频概览功能,提升用户生产力
2025-03-19 17:43:10
谷歌 Gemini 倒逼 OpenAI,ChatGPT AI 将升级 Moonshine 全局记忆
2025-02-15 09:59:19
谷歌Gemini推出“笔记本”功能
2026-04-09 12:06:09
继 OpenAI 后,谷歌 Gemini 模型将支持 Anthropic 的 MCP 协议
2025-04-10 09:41:10
谷歌 Gemini AI 升级文件分析功能,将支持 3GP、AVI、MP4 等 8 种视频格式
2025-04-08 11:48:49
监督学习也能从错误中学习反思?!清华英伟达联合提出隐式负向策略爆炸提升数学能力
2025-06-22 14:17:41
研究机构称DeepSeek在1月底的用户量就超越了谷歌Gemini
2025-02-07 08:50:22
谷歌 Gemini 客户端新增 AI 视频上传分析功能,支持 iOS / 安卓平台
2025-06-20 07:57:06
每天自动获取日历邮件摘要:谷歌 Gemini 安卓版应用新增“Scheduled Actions”功能
2025-06-07 11:47:40
科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1
2025-03-03 10:16:41
OpenAI 研究人员夸大 GPT-5 数学能力后删帖,遭杨立昆等业界人士批评
2025-10-19 08:45:17
766 文章
672075 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41