2025年7月,Kimi K2官方技术报告发布,揭示其训练秘籍。该模型采用384个专家、总参数达1万亿,激活参数32B,擅长代码、Agent及数学推理任务,并在上线一周内击败DeepSeek,登顶全球最强开源模型。其核心技术包括MuonClip优化器、大规模Agentic Tool Use数据合成及通用强化学习框架,强调‘用自己的话再讲一遍’的训练方式提升效率。此外,阿里通义Qwen3-235B-A22B-2507版本更新,官方称性能超越Kimi K2,或成新王者。
原文链接
本文链接:https://kx.umi6.com/article/22169.html
转载请注明文章出处
相关推荐
.png)
换一换
万亿参数Kimi K2开源,月之暗面研发工程师知乎亲述幕后故事
2025-07-15 10:40:09
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
2025-07-11 23:44:58
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
Perplexity CEO 称赞月之暗面,希望基于 Kimi K2 进行后训练
2025-07-13 15:03:51
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
Kimi K2官方技术报告出炉:采用384个专家,训练不靠刷题靠“用自己的话再讲一遍”
2025-07-22 15:34:45
Perplexity CEO表示或将利用Kimi K2进行后训练
2025-07-13 15:04:56
《自然》网站:中国AI模型“又一个DeepSeek时刻”
2025-07-17 15:30:35
Grok-4登顶,Kimi K2非思考模型SOTA
2025-07-18 12:38:47
“开源模型验货官”Perplexity,给Kimi K2盖了个戳
2025-07-21 11:17:17
探索通义大模型在 PC 端侧落地:阿里云官宣与惠普签署合作备忘录
2025-07-22 17:36:40
国家数据局:推进数据要素市场化配置改革和“人工智能+”行动同向发力 同频共振
2025-07-22 14:37:12
474 文章
80303 浏览
24小时热文
更多

-
2025-07-22 19:38:40
-
2025-07-22 19:37:31
-
2025-07-22 18:40:20