5月10日消息,谷歌为其Gemini 2.5 API推出“隐式缓存”功能,自动识别并重用API请求中的常见前缀,使开发者的成本最高降低75%。该功能适用于Gemini 2.5 Pro和Gemini 2.5 Flash模型。与2024年5月发布的“显式缓存”不同,“隐式缓存”无需开发者手动配置,系统默认开启,简化了操作流程。谷歌建议开发者在构建提示词时,将稳定内容置于开头,用户特定变量放于后方以提升缓存命中率。同时,Gemini 2.5 Flash需至少1024个Token,Pro需2048个Token,API响应新增“cached_content_token_count”字段展示缓存Token使用及计费详情。显式缓存仍作为可选方案支持Gemini 2.5及2.0模型,开发者可自定义缓存内容和TTL(默认1小时)。尽管谷歌声称成本节省可达75%,但具体效果还需第三方验证,且可能因使用模式不同而有所差异。
原文链接
本文链接:https://kx.umi6.com/article/18404.html
转载请注明文章出处
相关推荐
换一换
谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%
2025-05-10 12:05:40
57.1%的人分不清真假!Runway新视频模型太爆炸
2026-01-22 14:56:01
摩尔线程携手硅基流动实现DeepSeek-V3大模型高性能推理
2026-01-21 20:31:18
广东:支持各地市稳妥有序开放自动驾驶多场景道路测试应用 扩大高级别自动驾驶应用区域
2026-01-21 17:22:28
成都国资开年「闪击战」背后的产业野望
2026-01-21 20:24:37
最新调仓路径显现 基金经理关注确定性与安全边际
2026-01-22 07:43:21
阿联酋人工智能公司G42:未来几年内将数据中心总容量提升至5吉瓦
2026-01-21 17:23:33
凸显新型国际财经媒体优势 界面财联社旗下财跃星辰AI决策系统入选上海开源典型案例
2026-01-22 12:52:54
黄仁勋证实英伟达已取代苹果 成为台积电最大客户
2026-01-22 16:02:53
消息称李飞飞初创公司World Labs拟融资5亿美元 目标估值50亿美元
2026-01-23 17:08:55
事关AI聊天机器人和自动驾驶!马斯克和奥尔特曼隔空互喷
2026-01-21 20:25:45
钟南山:AI不是取代医生 而是为老百姓解决看病贵看病难的问题
2026-01-23 17:07:49
谷歌4D世界模型来了,比SOTA快300倍!
2026-01-23 17:05:32
666 文章
457887 浏览
24小时热文
更多
-
2026-01-23 18:11:40 -
2026-01-23 18:10:36 -
2026-01-23 18:09:30