1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Kimi开源底层推理框架Mooncake,1小时揽星1.2k

正文: 近日,Kimi宣布开源其底层推理架构Mooncake,仅一小时内便在GitHub上获得了1.2k的星标。

Kimi承载了线上80%以上的流量,此次开源的是其高性能KVCache多级缓存Mooncake Store。Mooncake采用分阶段方式开源,目前传输引擎Transfer Engine已在全球开源。

Mooncake的目标是为大模型时代打造高性能内存语义存储标准接口,并提供参考实现方案。Kimi工程副总裁许欣然表示,Mooncake由Kimi与清华大学MADSys实验室合作开发,实现了推理资源的极致优化,提升了用户体验,降低了成本,还有效解决了长文本和高并发需求。

Mooncake于今年6月启动,当时已受到广泛关注。Mooncake的论文《Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving》详细介绍了其系统架构,基于KVCache中心的解耦架构,提高了推理吞吐量。

Mooncake的核心在于以KVCache为中心的调度程序,平衡整体有效吞吐量和延迟要求。在流量高峰期,Mooncake采用早期拒绝策略和预测未来负载的方法处理超载问题。通过分析建模,Mooncake能估计未来的请求处理需求,并据此调整调度策略。实验结果显示,Mooncake在某些场景中的吞吐量提升了525%,且在实际工作负载下处理了75%以上的请求。

目前,Mooncake已承载了Kimi线上80%以上的流量。Mooncake开源项目吸引了AISoft、阿里云、华为存储、面壁智能、趋境科技等多家机构参与,旨在通过产学研力量共同推进模型推理系统的创新,让更多人受益于大模型技术。

原文链接
本文链接:https://kx.umi6.com/article/9409.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了
2025-05-20 18:43:16
小扎改口不开源,Meta股价暴涨12%
2025-08-01 08:56:20
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
2025-06-17 17:28:14
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
超越DeepSeek,中国开源「集团军」正重塑全球AI生态
2025-04-28 13:51:06
字节跳动开源其 AI IDE 工具核心组件 Trae-Agent
2025-07-07 08:24:33
DeepSeek开源新版R1 媲美OpenAI最高o3模型
2025-05-29 05:51:14
Kimi布局AI+医疗
2025-05-13 14:58:34
大模型开源后如何投资AI? 顶级创投看好中国企业“换道超车”的机会
2025-08-01 13:02:40
大模型套壳往事
2025-07-14 18:26:03
字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
2025-07-26 15:40:54
字节 Seed 开源统一多模态理解和生成模型 BAGEL
2025-06-03 19:01:17
24小时热文
更多
扫一扫体验小程序