1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

Kimi开源新突破:20秒更新万亿参数的中间件问世

Kimi开源再次带来惊喜!最新发布的中间件“checkpoint-engine(检查点引擎)”,让Kimi K2模型在数千个GPU上仅需约20秒即可完成1万亿参数的更新,进入“秒更时代”。

该中间件专为强化学习设计,优化了大语言模型推理中的权重更新流程。Kimi K2采用混合共置架构,将训练与推理引擎部署在同一组节点上,通过动态资源调配实现高效协作。然而,随着模型规模扩展至万亿参数级别,传统方法在参数同步和故障恢复上的延迟问题愈发突出。

为解决这一难题,研究团队开发了分布式检查点引擎。它通过本地参数副本广播和流水线技术显著降低内存占用,并实现高效参数更新。具体而言,更新过程分为三阶段:H2D传输、广播和重载。尽管理想流水线尚未完全实现,但当前的两阶段方案已大幅简化系统设计,同时保持高性能。

此外,该引擎还支持独立副本重启,避免了推理引擎间的同步屏障,提升了系统的容错能力。通过集体读取检查点和选择性磁盘IO操作,进一步减少了启动时间和昂贵的磁盘开销。

这一创新不仅显著提升了Kimi K2的效率,也为大规模AI模型的训练和推理提供了重要参考。

参考链接:
[1] https://x.com/Kimi_Moonshot/status/1965785427530629243
[2] https://github.com/MoonshotAI/checkpoint-engine
[3] https://arxiv.org/abs/2507.20534

原文链接
本文链接:https://kx.umi6.com/article/25046.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Kimi开源又放大招!20秒更新万亿参数的中间件来了
2025-09-11 14:56:36
特斯拉 Optimus 人形机器人演示时摔倒,手忙脚乱“摘头显”露了馅
2025-12-08 15:33:43
8 年首次大突破:谷歌祭出 Transformer 杀手,掌门人划出 AGI 死线
2025-12-07 15:34:40
OpenAI、阿里、字节们的AI硬件战事:害怕错过下一代入口
2025-12-06 12:27:46
特斯拉之后 Figure AI 也秀肌肉:Figure 03 人形机器人跑起来,还是折返跑
2025-12-05 19:47:48
AI可穿戴公司Limitless宣布被Meta收购
2025-12-06 07:17:46
智能体A2A落地华为新旗舰,鸿蒙开发者新机遇来了
2025-12-06 12:27:36
微博CEO王高飞谈AI手机:发微博功能待确认 主流应用操作存限制
2025-12-08 16:38:11
机器人集体到香港户外自主极限挑战,四足比人形强
2025-12-08 15:34:35
西北首台量子计算机落地西安
2025-12-07 08:18:21
用AI图仅退款,这批羊毛党把商家薅麻了
2025-12-08 12:24:10
厦门“十五五”规划建议:强化算力、算法、数据等高效供给 发展壮大数字经济核心产业
2025-12-08 14:32:20
谷歌 Gemini 3 反击战:OpenAI GPT-5.2 被曝提前至下周发布,从新功能转向速度与稳定性提升
2025-12-06 09:19:14
24小时热文
更多
扫一扫体验小程序