《科创板日报》报道,月之暗面Kimi发布新技术报告,推出‘Moonlight’模型,该模型基于Muon训练,参数量分别为30亿和160亿。使用了5.7万亿个token进行训练,在较低的浮点运算次数下实现更优性能,提升了帕累托效率边界。
原文链接
本文链接:https://kx.umi6.com/article/14143.html
转载请注明文章出处
相关推荐
.png)
换一换
月之暗面仲裁风波非个例 一级市场“信义义务”引重视|K时评
2024-12-17 11:07:14
一文详解:DeepSeek刚开源的DeepGEMM是怎么回事?
2025-02-26 14:36:20
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
2025-07-11 23:44:58
小米向月之暗面转让多枚Kimi商标
2025-06-03 10:56:46
月之暗面开源Moonlight:30亿/160亿参数混合专家模型
2025-02-24 09:20:48
月之暗面卷入仲裁漩涡,都是利益惹的祸?
2024-11-12 17:12:14
梁文锋和杨植麟再“撞车”
2025-05-04 13:03:55
月之暗面几位出海产品负责人据悉离职创业
2024-11-12 11:06:18
月之暗面发布k1.5多模态思考模型
2025-01-20 23:27:40
性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent
2025-06-23 09:22:20
Perplexity CEO 称赞月之暗面,希望基于 Kimi K2 进行后训练
2025-07-13 15:03:51
DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库
2025-02-25 12:00:43
月之暗面发布数学大模型,对标OpenAI o1
2024-11-21 16:37:48
554 文章
293800 浏览
24小时热文
更多

-
2025-10-24 05:23:38
-
2025-10-24 03:21:23
-
2025-10-24 01:20:07