正文:11月28日,月之暗面Kimi与清华大学MADSys实验室联合发布开源大模型推理架构Mooncake,旨在提升推理吞吐量。该项目基于KVCache中心的PD分离和存算架构,已在GitHub开源上线。Mooncake由多家公司合作推进,包括9#AISoft、阿里云、华为存储、面壁智能和趋境科技。该项目从论文延伸而来,采用超大规模KVCache缓存池,通过存算理念减少算力开销。Mooncake将分阶段开源,目前Transfer Engine部分已全球开源,未来计划逐步开放高性能KVCache多级缓存Mooncake Store及兼容各类推理引擎和存储资源。最终目标是为大模型时代创建新型高性能内存语义存储标准接口。网址:
原文链接
本文链接:https://kx.umi6.com/article/9393.html
转载请注明文章出处
相关推荐
.png)
换一换
体验Kimi的新功能后,我为月之暗面捏把汗
2025-04-30 22:06:18
DeepSeek风暴里的月之暗面
2025-02-15 14:05:11
Kimi创始人杨植麟被前投资人提起仲裁,消息指涉金沙江创投等5家投资方
2024-11-11 16:52:28
471 文章
78812 浏览
24小时热文
更多

-
2025-07-20 08:01:35
-
2025-07-19 22:57:32
-
2025-07-19 21:58:20