2025年7月,Kimi K2官方技术报告发布,揭示其训练秘籍。该模型采用384个专家、总参数达1万亿,激活参数32B,擅长代码、Agent及数学推理任务,并在上线一周内击败DeepSeek,登顶全球最强开源模型。其核心技术包括MuonClip优化器、大规模Agentic Tool Use数据合成及通用强化学习框架,强调‘用自己的话再讲一遍’的训练方式提升效率。此外,阿里通义Qwen3-235B-A22B-2507版本更新,官方称性能超越Kimi K2,或成新王者。
原文链接
本文链接:https://kx.umi6.com/article/22169.html
转载请注明文章出处
相关推荐
换一换
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
月之暗面 Kimi K2 宣布更新:上下文长度扩展至 256K,带来更快的 API
2025-09-05 12:17:23
美国“SPAC之王”查马斯:公司已转用Kimi K2
2025-10-11 19:32:28
Kimi K2.1/K2.5?消息称月之暗面今年年初拟上线多模态新模型
2026-01-01 19:33:56
月之暗面发布 Kimi K2 高速版:输出速度提升至每秒 40 Tokens
2025-08-01 15:06:32
Perplexity CEO表示或将利用Kimi K2进行后训练
2025-07-13 15:04:56
万亿参数Kimi K2开源,月之暗面研发工程师知乎亲述幕后故事
2025-07-15 10:40:09
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
“开源模型验货官”Perplexity,给Kimi K2盖了个戳
2025-07-21 11:17:17
Perplexity CEO 称赞月之暗面,希望基于 Kimi K2 进行后训练
2025-07-13 15:03:51
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
Grok-4登顶,Kimi K2非思考模型SOTA
2025-07-18 12:38:47
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
2025-07-11 23:44:58
693 文章
477881 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44