正文:11月28日,月之暗面Kimi与清华大学MADSys实验室联合发布开源大模型推理架构Mooncake,旨在提升推理吞吐量。该项目基于KVCache中心的PD分离和存算架构,已在GitHub开源上线。Mooncake由多家公司合作推进,包括9#AISoft、阿里云、华为存储、面壁智能和趋境科技。该项目从论文延伸而来,采用超大规模KVCache缓存池,通过存算理念减少算力开销。Mooncake将分阶段开源,目前Transfer Engine部分已全球开源,未来计划逐步开放高性能KVCache多级缓存Mooncake Store及兼容各类推理引擎和存储资源。最终目标是为大模型时代创建新型高性能内存语义存储标准接口。网址:
原文链接
本文链接:https://kx.umi6.com/article/9393.html
转载请注明文章出处
相关推荐
换一换
刚刚,31岁的杨植麟回应一切
2024-11-16 17:33:12
Kimi“憋”出的深度研究,成色几何?
2025-07-01 15:26:59
GPT-5来了,Kimi却掉队了
2025-08-12 15:22:00
一键生成PPT,Kimi :让「PPT民工」先浪起来
2024-07-31 19:40:56
刚刚,Kimi开源底层推理框架,1小时GitHub揽星1.2k
2024-11-28 16:30:28
为什么说DeepSeek是2025年的Kimi
2025-01-02 11:17:24
Kimi杨植麟该为“重投放”反思吗?
2025-02-13 22:20:54
Kimi和DeepSeek又撞车?
2025-06-04 15:24:39
月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake
2024-11-28 13:26:54
AI投流战,投不出未来
2024-08-26 18:34:51
能看风水 夸我有情趣 Kimi现在都这么野了吗
2024-12-19 00:42:58
杨植麟还没有解开月之暗面的局
2024-11-21 08:25:43
实测Kimi全新Agent模型「OK Computer」,很OK
2025-09-27 11:39:21
579 文章
291125 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35