5月10日消息,谷歌为其Gemini 2.5 API推出“隐式缓存”功能,自动识别并重用API请求中的常见前缀,使开发者的成本最高降低75%。该功能适用于Gemini 2.5 Pro和Gemini 2.5 Flash模型。与2024年5月发布的“显式缓存”不同,“隐式缓存”无需开发者手动配置,系统默认开启,简化了操作流程。谷歌建议开发者在构建提示词时,将稳定内容置于开头,用户特定变量放于后方以提升缓存命中率。同时,Gemini 2.5 Flash需至少1024个Token,Pro需2048个Token,API响应新增“cached_content_token_count”字段展示缓存Token使用及计费详情。显式缓存仍作为可选方案支持Gemini 2.5及2.0模型,开发者可自定义缓存内容和TTL(默认1小时)。尽管谷歌声称成本节省可达75%,但具体效果还需第三方验证,且可能因使用模式不同而有所差异。
原文链接
本文链接:https://kx.umi6.com/article/18404.html
转载请注明文章出处
相关推荐
换一换
谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%
2025-05-10 12:05:40
SEE Conf 2025:开启体验科技的新十年
2025-10-24 17:46:00
能懂孩子、懂爸妈、还懂宠物,这届AI硬件太会了
2025-10-25 15:28:07
OpenAI 宣布 ChatGPT 新功能上线:让 AI 理解并使用公司内部“知识”,新增跨平台信息整合与安全控制功能
2025-10-24 21:54:02
2025豫台经贸洽谈会开幕 签约近300亿元合作项目
2025-10-24 13:37:40
摩尔线程、国家信息中心战略合作!国产GPU空前新机遇
2025-10-23 20:13:57
“996”都算偷懒?硅谷AI精英化身“卷王”:每周狂干100小时!
2025-10-24 11:37:10
云计算“活教科书”语出惊人,指明程序员的进化方向
2025-10-24 16:43:46
OpenAI 预告“AI 浏览器”ChatGPT Atlas 未来更新:标签组、广告拦截器等
2025-10-24 09:30:10
字节Seed团队推出3D生成大模型Seed3D 1.0
2025-10-23 16:12:12
快手进军AI编程!“模型+工具+平台”一口气放三个大招
2025-10-24 16:44:56
全国人大常委会法工委:网络安全法拟增加促进AI安全与发展内容
2025-10-23 18:13:26
Claude 看齐 ChatGPT 新增 AI 自动记忆,能记住你的每一次对话
2025-10-24 09:31:18
548 文章
263461 浏览
24小时热文
更多
-
2025-10-26 00:45:16 -
2025-10-25 23:44:04 -
2025-10-25 22:43:52