1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月10日消息,谷歌为其Gemini 2.5 API推出“隐式缓存”功能,自动识别并重用API请求中的常见前缀,使开发者的成本最高降低75%。该功能适用于Gemini 2.5 Pro和Gemini 2.5 Flash模型。与2024年5月发布的“显式缓存”不同,“隐式缓存”无需开发者手动配置,系统默认开启,简化了操作流程。谷歌建议开发者在构建提示词时,将稳定内容置于开头,用户特定变量放于后方以提升缓存命中率。同时,Gemini 2.5 Flash需至少1024个Token,Pro需2048个Token,API响应新增“cached_content_token_count”字段展示缓存Token使用及计费详情。显式缓存仍作为可选方案支持Gemini 2.5及2.0模型,开发者可自定义缓存内容和TTL(默认1小时)。尽管谷歌声称成本节省可达75%,但具体效果还需第三方验证,且可能因使用模式不同而有所差异。

原文链接
本文链接:https://kx.umi6.com/article/18404.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%
2025-05-10 12:05:40
两部门要求推进“人工智能 +”能源高质量发展,虚拟电厂概念相关企业直线涨停
2025-09-08 10:55:15
OpenAI今年预计通过ChatGPT实现近100亿美元收入,机构称GPT-5将给硬件和应用端这些企业带来机遇
2025-09-06 16:37:17
2025年了,AI还看不懂时钟?
2025-09-08 21:03:50
傅利叶首款陪伴机器人 GR-3 开启预售:身高 165cm,全身柔肤软包
2025-09-08 10:54:56
OpenAI 研究人员宣称已破解模型“幻觉”难题:现有评估方式在鼓励 AI“瞎蒙”
2025-09-06 16:36:08
时空壶发布W4:用“硬核”技术,打赢一场AI 翻译的“标准”之战
2025-09-07 20:50:36
硅谷版的“莞莞类卿”?分析师称博通业绩增速令人想起早年的英伟达
2025-09-06 15:35:56
OpenAI的00后“叛徒”正在碾压华尔街“老江湖”
2025-09-06 16:36:53
通义千问系列最强大的语言模型:Qwen3-Max-Preview 上线
2025-09-06 00:26:52
OpenAI内部大重组
2025-09-08 19:01:56
独家|宇树科技:目前公司未讨论过IPO估值
2025-09-08 20:04:22
OpenAI罕见发论文:我们找到了AI幻觉的罪魁祸首
2025-09-06 11:35:08
24小时热文
更多
扫一扫体验小程序