1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

Kimi开源新突破:20秒更新万亿参数的中间件问世

Kimi开源再次带来惊喜!最新发布的中间件“checkpoint-engine(检查点引擎)”,让Kimi K2模型在数千个GPU上仅需约20秒即可完成1万亿参数的更新,进入“秒更时代”。

该中间件专为强化学习设计,优化了大语言模型推理中的权重更新流程。Kimi K2采用混合共置架构,将训练与推理引擎部署在同一组节点上,通过动态资源调配实现高效协作。然而,随着模型规模扩展至万亿参数级别,传统方法在参数同步和故障恢复上的延迟问题愈发突出。

为解决这一难题,研究团队开发了分布式检查点引擎。它通过本地参数副本广播和流水线技术显著降低内存占用,并实现高效参数更新。具体而言,更新过程分为三阶段:H2D传输、广播和重载。尽管理想流水线尚未完全实现,但当前的两阶段方案已大幅简化系统设计,同时保持高性能。

此外,该引擎还支持独立副本重启,避免了推理引擎间的同步屏障,提升了系统的容错能力。通过集体读取检查点和选择性磁盘IO操作,进一步减少了启动时间和昂贵的磁盘开销。

这一创新不仅显著提升了Kimi K2的效率,也为大规模AI模型的训练和推理提供了重要参考。

参考链接:
[1] https://x.com/Kimi_Moonshot/status/1965785427530629243
[2] https://github.com/MoonshotAI/checkpoint-engine
[3] https://arxiv.org/abs/2507.20534

原文链接
本文链接:https://kx.umi6.com/article/25046.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Kimi开源又放大招!20秒更新万亿参数的中间件来了
2025-09-11 14:56:36
2025人工智能年度评选启动!3大维度5类奖项,正在寻找AI+时代领航者
2025-09-11 17:01:00
蚂蚁集团CEO韩歆毅:AI仍无法替代医生 面临高质量数据、抑制幻觉和科技伦理等难题
2025-09-11 16:00:27
美国参议员提议设立人工智能沙盒,以放宽对科技公司的监管
2025-09-11 00:45:04
【立即预约】2025腾讯全球数字生态大会定档,锁定9月16-17日!
2025-09-10 19:41:18
国家网信办副主任王京涛:会同行业主管部门研究制定人工智能行业应用安全指南
2025-09-11 13:58:54
京东方:未来三年投入研发资金500亿元、采购资金5000亿元 支持产业链技术突破和产业升级
2025-09-11 13:56:43
广西:支持智能产品产业化 对具有引领作用项目给予最高1000万元补助
2025-09-11 12:55:59
第二次中英产业合作对话在京举行
2025-09-10 21:44:18
3年1000台!全球半导体显示产业首次迎来具身智能机器人
2025-09-11 16:58:43
蚂蚁集团CEO韩歆毅:在医疗健康领域 专业AI做到极致会更强
2025-09-11 17:05:26
软银集团股价上涨10% 股价收于历史高位
2025-09-11 15:59:18
3000 亿美元历史级大单:消息称 OpenAI 与 Oracle 甲骨文达成重磅云计算交易
2025-09-11 09:50:48
24小时热文
更多
扫一扫体验小程序