5月10日消息,谷歌为其Gemini 2.5 API推出“隐式缓存”功能,自动识别并重用API请求中的常见前缀,使开发者的成本最高降低75%。该功能适用于Gemini 2.5 Pro和Gemini 2.5 Flash模型。与2024年5月发布的“显式缓存”不同,“隐式缓存”无需开发者手动配置,系统默认开启,简化了操作流程。谷歌建议开发者在构建提示词时,将稳定内容置于开头,用户特定变量放于后方以提升缓存命中率。同时,Gemini 2.5 Flash需至少1024个Token,Pro需2048个Token,API响应新增“cached_content_token_count”字段展示缓存Token使用及计费详情。显式缓存仍作为可选方案支持Gemini 2.5及2.0模型,开发者可自定义缓存内容和TTL(默认1小时)。尽管谷歌声称成本节省可达75%,但具体效果还需第三方验证,且可能因使用模式不同而有所差异。
原文链接
本文链接:https://kx.umi6.com/article/18404.html
转载请注明文章出处
相关推荐
换一换
我国最大规模科学智能集群接入全国一体化算力网
2026-04-28 16:27:10
英矽智能:Rentosertib吸入制剂获得CDE临床试验批准
2026-04-29 09:09:01
不卷参数卷架构,这个开源模型把图像理解和生成统一了
2026-04-29 13:24:11
LG电子:与英伟达讨论在机器人方面进行全面战略合作
2026-04-29 16:33:03
巴克莱:“AI终结SaaS论”在现实中存在缪误
2026-04-29 19:40:15
科思科技推出基于昇腾910B芯片的全国产全加固智能计算模组
2026-04-28 12:13:46
报道称OpenAI未达销售目标 相关股票大跌
2026-04-28 18:33:59
2025年我国系统软件、人工智能产生的数据量达26.92泽字节 首次超过传统占主体地位的物联感知数据量
2026-04-29 12:23:17
康众医疗在浙江成立智能机器人公司
2026-04-28 14:21:03
韩国与卡塔尔官员商讨先进产业投资合作事宜
2026-04-29 15:30:20
当200位具身从业者被拉进同一个屋子
2026-04-28 13:13:03
中兴通讯子公司等成立云计算公司
2026-04-28 12:12:40
小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪
2026-04-29 09:06:54
737 文章
631815 浏览
24小时热文
更多
-
2026-04-30 00:49:05 -
2026-04-29 22:45:47 -
2026-04-29 21:43:37