5月10日消息,谷歌为其Gemini 2.5 API推出“隐式缓存”功能,自动识别并重用API请求中的常见前缀,使开发者的成本最高降低75%。该功能适用于Gemini 2.5 Pro和Gemini 2.5 Flash模型。与2024年5月发布的“显式缓存”不同,“隐式缓存”无需开发者手动配置,系统默认开启,简化了操作流程。谷歌建议开发者在构建提示词时,将稳定内容置于开头,用户特定变量放于后方以提升缓存命中率。同时,Gemini 2.5 Flash需至少1024个Token,Pro需2048个Token,API响应新增“cached_content_token_count”字段展示缓存Token使用及计费详情。显式缓存仍作为可选方案支持Gemini 2.5及2.0模型,开发者可自定义缓存内容和TTL(默认1小时)。尽管谷歌声称成本节省可达75%,但具体效果还需第三方验证,且可能因使用模式不同而有所差异。
原文链接
本文链接:https://kx.umi6.com/article/18404.html
转载请注明文章出处
相关推荐
换一换
阿里云百炼宣布DeepSeek-V4-Pro模型隐式缓存降价
2026-04-29 21:43:37
云计算一哥,让小鹏、Kimi和猎豹都爽了一把
2026-06-23 21:55:04
AI硬件席卷618,钉钉A1包揽天猫、抖音、京东销量冠军
2026-06-22 14:45:14
周鸿祎:AI不会带来大规模裁员 出错后还得有人给AI擦屁股
2026-06-24 18:46:20
要抢英伟达生意!亚马逊洽谈外销自研AI芯片
2026-06-22 14:48:32
终于要变聪明了!特斯拉官宣接入豆包
2026-06-24 15:38:03
魔法原子牵手万机易租,全栈产品入驻2.0平台共建租赁生态
2026-06-18 21:46:18
机器人全栈操作系统!老黄率先抛出“具身版安卓”
2026-06-23 14:38:31
Meta员工士气跌至20年谷底!内部直播当众开骂,CTO承认AI重组糟糕透顶
2026-06-20 18:17:03
新研究:过度依赖AI削弱批判性思维 识假能力降15%
2026-06-21 22:12:12
2026世界人工智能大会SAIL奖TOP30及青年优秀论文奖TOP20发布
2026-06-24 12:27:10
马斯克又盯上AI基建:特斯拉要卖“算力积木”了
2026-06-23 14:36:55
不用独显也能跑AI Intel和AMD罕见达成共识
2026-06-22 11:38:55
767 文章
802436 浏览
24小时热文
更多
-
2026-06-25 18:37:27 -
2026-06-25 18:33:04 -
2026-06-25 18:31:26