1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

国产大模型Kimi的最新论文揭示其推理架构Mooncake,这款分离式设计的系统可高效应对80%的高流量。Mooncake通过KV缓存、分离的Prefill和Decoding节点集群,以及RDMA通信,提升了525%的吞吐量和75%的请求处理能力。核心策略包括智能调度、热点迁移和基于预测的早期拒绝,有效降低延迟并适应复杂负载。论文详细介绍了Mooncake的内部机制及优化效果,展示在ArXiv和L-Eval数据集上的显著性能提升。随着大模型服务需求的增长,月之暗面团队将继续优化硬件友好的分布式策略。

原文链接
本文链接:https://kx.umi6.com/article/2733.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Kimi创始人杨植麟被前投资人提起仲裁,消息指涉金沙江创投等5家投资方
2024-11-11 16:52:28
月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake
2024-11-28 13:26:54
Kimi杨植麟该为“重投放”反思吗?
2025-02-13 22:20:54
一键生成PPT,Kimi :让「PPT民工」先浪起来
2024-07-31 19:40:56
Kimi论文自曝推理架构,80%流量都靠它承担
2024-07-05 15:35:18
月之暗面回应Kimi崩了:目前已恢复
2024-10-11 14:07:08
ChatGPT Agent遭暴击,国产AI轮番“公开处刑”
2025-07-19 12:51:53
AI投流战,投不出未来
2024-08-26 18:34:51
Kimi用浏览器插件落地AI:比网页方便,但功能局限
2024-07-10 08:26:11
从豆包到 Kimi,为什么 AI 产品都在做浏览器插件
2024-07-17 20:49:30
杨植麟还没有解开月之暗面的局
2024-11-21 08:25:43
智谱清言、Kimi等被通报非法收集使用个人信息
2025-05-20 21:49:38
Kimi 发布新一代数学推理模型 k0-math
2024-11-16 19:36:51
24小时热文
更多
扫一扫体验小程序