【2023年2月2日】私募巨头幻方量化旗下新组织"深度求索"宣布采用上下文硬盘缓存技术,旨在优化大模型API的使用效率。该技术将预估需重复使用的数据存储于分布式硬盘阵列,以减少不必要的计算过程。在具体应用中,当输入内容重复时,只需从缓存中读取,无需重新计算,此举有望使大模型成本降低一个数量级。目前,缓存命中部分的费用设定为每百万tokens 0.1元。这一创新策略不仅提高了大模型的运行效率,也为降低成本开辟了新路径。
原文链接
本文链接:https://kx.umi6.com/article/4481.html
转载请注明文章出处
相关推荐
换一换
英伟达的最大空头出现了
2024-12-31 15:46:07
幻方量化旗下DeepSeek发布V2.5模型
2024-09-06 18:17:45
DeepSeek等大模型集体“打标”,从此告别AI造假?
2025-09-02 17:35:56
DeepSeek母公司去年进账50亿,够烧2380个R1
2026-01-13 16:43:30
中央网信办总工程师孙蔚敏:国内数十家大模型厂商已在政务领域展开探索
2024-05-24 23:19:47
幻方量化相关人士回应“DeepSeek-R2 模型提前发布”:以官方消息为准
2025-02-26 08:21:28
幻方量化旗下大模型厂商启用硬盘缓存技术 大模型价格再降一个数量级
2024-08-02 22:07:33
梁文锋旗下幻方量化去年收益率56.6% 管理规模已超700亿元
2026-01-14 19:55:39
中兴通讯相关人士:目前已收到部分大模型厂合作邀约 相关沟通正在推进
2025-12-24 16:52:26
北京经济技术开发区:实施智能网联领航行动 强化人工智能在智能网联领域的数据驱动与技术引领作用
2026-01-31 22:03:47
独家I松应科技连续完成 Pre-A、Pre-A+ 轮融资
2026-02-02 09:28:35
何恺明带大二本科生颠覆扩散图像生成:扔掉多步采样和潜空间,一步像素直出
2026-02-02 16:48:05
Nature | 清北合作研发全球首个全柔性存算一体AI芯片
2026-02-02 16:46:48
668 文章
425066 浏览
24小时热文
更多
-
2026-02-03 14:43:25 -
2026-02-03 14:42:50 -
2026-02-03 14:42:20