Claude最新推出了API长文本缓存功能,将成本降低了90%,使得一次性记住整个代码库成为可能。这一功能借鉴了谷歌Gemini的同款提示词缓存,并得到了国内团队Kimi和DeepSeek的跟进。通过缓存,用户可以在后续请求中直接复用内容,大幅减少处理长文本的延迟时间和成本。Claude的官方文档列举了几个应用场景,如对话、代码助理、大型文档处理等,均显示出了显著的速度提升和成本节约。对于开发者而言,这项更新意味着能够更高效地利用AI资源,比如一次向模型提供整个代码库,要求增加新功能,或是直接输入大量文档而不必重复输入。尽管不同平台在实现细节上有所差异,但这种模式已经受到顶级玩家的青睐,预计将成为大模型厂商的标准配置。
原文链接
本文链接:https://kx.umi6.com/article/5049.html
转载请注明文章出处
相关推荐
换一换
成本降低90%!Claude上新Gemini同款提示词缓存,一次性记住整个代码库
2024-08-16 06:31:02
腾讯混元世界模型 1.1 版本发布并开源:单卡即可部署,秒级创造 3D 世界
2025-10-22 18:50:23
Meta削减人工智能部门约600个职位,精简架构以加速组织转型
2025-10-23 02:55:30
太疯狂了!Meta裁员裁到田渊栋头上,连组员一锅端
2025-10-23 13:04:46
我国网络安全法修正草案拟完善 AI 伦理规范,加强安全监管
2025-10-23 15:10:09
OpenAI 挖走“快捷指令”原创团队,将为 ChatGPT 打造 Mac 桌面级 AI
2025-10-24 07:25:57
独家|阿里夸克“C计划”揭晓 上线对话助手 把“豆包”塞了进去
2025-10-23 10:05:55
田渊栋被裁后新offer排到法国!原来Llama 4.5训完后被卸磨杀驴了
2025-10-24 09:29:01
OpenAI合作伙伴Crusoe在新一轮融资中估值达100亿美元
2025-10-24 03:21:23
硅谷又现AI算力巨额订单!谷歌与Anthropic达成数百亿美元合作
2025-10-24 08:29:28
放开成人内容,OpenAI是为了提升性能?
2025-10-22 17:49:49
东软集团新增AI相关业务
2025-10-23 11:03:14
慧思开物SDK正式开放 北京人形加速构建具身智能生态新格局
2025-10-23 15:11:25
562 文章
260690 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35