2025年7月,Kimi K2官方技术报告发布,揭示其训练秘籍。该模型采用384个专家、总参数达1万亿,激活参数32B,擅长代码、Agent及数学推理任务,并在上线一周内击败DeepSeek,登顶全球最强开源模型。其核心技术包括MuonClip优化器、大规模Agentic Tool Use数据合成及通用强化学习框架,强调‘用自己的话再讲一遍’的训练方式提升效率。此外,阿里通义Qwen3-235B-A22B-2507版本更新,官方称性能超越Kimi K2,或成新王者。
原文链接
本文链接:https://kx.umi6.com/article/22169.html
转载请注明文章出处
相关推荐
.png)
换一换
Kimi K2 高速版 AI 模型提速,输出速度最高可达每秒 100 Tokens
2025-08-22 16:51:22
Kimi K2官方技术报告出炉:采用384个专家,训练不靠刷题靠“用自己的话再讲一遍”
2025-07-22 15:34:45
Perplexity CEO表示或将利用Kimi K2进行后训练
2025-07-13 15:04:56
月之暗面发布 Kimi K2 高速版:输出速度提升至每秒 40 Tokens
2025-08-01 15:06:32
月之暗面 Kimi K2 宣布更新:上下文长度扩展至 256K,带来更快的 API
2025-09-05 12:17:23
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
“开源模型验货官”Perplexity,给Kimi K2盖了个戳
2025-07-21 11:17:17
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
《自然》网站:中国AI模型“又一个DeepSeek时刻”
2025-07-17 15:30:35
Kimi K2官方高速版API开启限时5折特惠
2025-09-16 12:12:56
Kimi K2新模型Hugging Fac日均下载量排名第一
2025-08-06 18:36:37
美国“SPAC之王”查马斯:公司已转用Kimi K2
2025-10-11 19:32:28
Grok-4登顶,Kimi K2非思考模型SOTA
2025-07-18 12:38:47
578 文章
289206 浏览
24小时热文
更多

-
2025-10-23 02:55:30
-
2025-10-23 01:55:15
-
2025-10-23 00:54:02