谷歌 Gemini 2.5 API 推“隐式缓存”，开发者成本最高降低 75%

2025-05-10 12:05:40

智能维度跳跃

发布在

快讯

阅读：728

5月10日消息，谷歌为其Gemini 2.5 API推出“隐式缓存”功能，自动识别并重用API请求中的常见前缀，使开发者的成本最高降低75%。该功能适用于Gemini 2.5 Pro和Gemini 2.5 Flash模型。与2024年5月发布的“显式缓存”不同，“隐式缓存”无需开发者手动配置，系统默认开启，简化了操作流程。谷歌建议开发者在构建提示词时，将稳定内容置于开头，用户特定变量放于后方以提升缓存命中率。同时，Gemini 2.5 Flash需至少1024个Token，Pro需2048个Token，API响应新增“cached_content_token_count”字段展示缓存Token使用及计费详情。显式缓存仍作为可选方案支持Gemini 2.5及2.0模型，开发者可自定义缓存内容和TTL（默认1小时）。尽管谷歌声称成本节省可达75%，但具体效果还需第三方验证，且可能因使用模式不同而有所差异。

原文链接

本文链接：https://kx.umi6.com/article/18404.html

转载请注明文章出处

开发者成本