
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:Gemini 2.5弯道超车的背后
正文:去年,谷歌的Gemini还在追赶,而今年Gemini 2.5 Pro已在多项评测中全面领先。短短一年间,谷歌是如何实现逆袭的?《硅谷101》创始人泓君邀请了Energent.ai联合创始人Kimi Kong和HeyRevia创始人Shaun Wei...
原文链接
谷歌在I/O大会上推出多项AI升级,Gemini 2.5 Pro和Flash预览版霸榜前二。Gemini 2.5 Pro引入Deep Think增强推理模式,提升长上下文和视频理解能力,在多领域基准测试中表现优异。新版Veo 3视频模型实现原生音画同步生成,Imagen 4图像模型生成效果更精细,速度提升10倍。谷歌搜索引入AI Mode,支持端到端AI搜索和实时互动功能,购物体验升级支持虚拟试穿和智能结账。新增异步代码助手Jules,可在后台处理代码任务。此外,AI眼镜和Google Beam等新产品亮相,提升交互体验。谷歌表示,AI应用规模快速增长,每月处理tokens量达480万亿以上。
原文链接
5月10日消息,谷歌为其Gemini 2.5 API推出“隐式缓存”功能,自动识别并重用API请求中的常见前缀,使开发者的成本最高降低75%。该功能适用于Gemini 2.5 Pro和Gemini 2.5 Flash模型。与2024年5月发布的“显式缓存”不同,“隐式缓存”无需开发者手动配置,系统默...
原文链接
谷歌Gemini 2.5 Pro在直播中成功通关经典游戏《宝可梦蓝》,成为首个登入宝可梦名人堂的大模型。这一成就引发网友热议,称赞其表现酷炫。Gemini通过复杂的决策流程完成游戏,包括图像分析、数据处理及按钮操作等步骤,但其过程因深思熟虑而显得缓慢。与人类玩家相比,大模型在解读低分辨率像素化画面及二维地图时存在困难,且上下文限制也影响了游戏表现。尽管如此,Gemini在文本交互部分已有亮眼表现,例如理解宝可梦属性克制关系。此次直播标志着AI技术新进展,未来可能成为评估大模型能力的新基准。直播仍在继续,可通过Twitch平台观看。
原文链接
4月17日,谷歌宣布推出Gemini 2.5 Flash预览版AI模型,可通过Google AI Studio和Vertex AI中的Gemini API访问。该模型支持用户通过Gemini应用内模型选择器直接使用,并能结合Canvas工具优化文档与代码编辑。作为首个全混合推理模型,Gemini 2.5 Flash专为高容量和实时场景设计,如客户服务与文档解析,可显著降低延迟并减少成本。谷歌强调其适合作为虚拟助手及实时总结工具的核心引擎。定价方面,输入每100万tokens收费0.15美元,输出(不含推理)为0.6美元,输出(含推理)为3.5美元。相比Anthropic和Grok的同类产品,Gemini 2.5 Flash在成本控制上更具优势,同时保持较高性能表现。
原文链接
谷歌Deep Research推出Gemini 2.5 Pro,性能全面提升,包括逻辑推理、信息整合及报告洞察力。相比OpenAI DR,性能提升超40%,生成的报告受评估者高度认可。在测试中,该系统仅用5分钟便完成了46页的纳米技术学术论文,并能将其转化为10分钟播客。沃顿商学院教授也证实,Gemini 2.5加持的DR在市场分析上表现优异。尽管存在token限制导致报告中断的问题,但谷歌DeepMind已在数据、硬件、模型及人才等方面占据优势,巩固其在AGI竞赛中的领先地位。此次升级率先面向Gemini Advanced订阅用户,价格仅为19.99美元/月。AGI竞赛如火如荼,谷歌正全力冲刺。
原文链接
谷歌于3月26日发布Gemini 2.5系列,首发版本Gemini 2.5 Pro在多项基准测试中表现优异,位居LMArena榜首。Gemini 2.5 Pro支持文本、图像、音频、视频及代码等多种输入模式,其上下文窗口可达100万token,未来将升级至200万token,大幅提升跨模态复杂问题处理能力。该模型具备思维链推理能力,能在处理任务时进行系统化推演,显著提高性能与准确性。目前,Gemini 2.5 Pro已上线谷歌AI Studio及Gemini Advanced专区,支持移动端与桌面端,适用于智能客服、数据分析、内容创作等场景。此外,在无需增加计算成本的技术条件下,该模型在GPQA与2025年AIME等测试中名列前茅,展现卓越的高级推理能力。
原文链接
加载更多

暂无内容