《科创板日报》报道,月之暗面Kimi发布新技术报告,推出‘Moonlight’模型,该模型基于Muon训练,参数量分别为30亿和160亿。使用了5.7万亿个token进行训练,在较低的浮点运算次数下实现更优性能,提升了帕累托效率边界。
原文链接
本文链接:https://kx.umi6.com/article/14143.html
转载请注明文章出处
相关推荐
换一换
传月之暗面完成 3 亿美元融资,最新估值 33 亿美元;OpenAI 加持,最强人形机器人 Figure 02 登场丨AI情报局
2024-08-07 11:28:15
月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%
2025-11-27 16:43:04
月之暗面据称考虑赴香港进行IPO
2026-03-26 18:14:06
月之暗面宣布:上下文缓存Cache存储费用降价50%
2024-08-07 14:29:59
Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能较 HGX 200 提升 10 倍
2025-12-04 12:20:54
创始人被前投资人提起仲裁 月之暗面回应:不具备事实基础
2024-11-11 16:47:01
月之暗面 Kimi 开放平台上下文缓存 Cache 存储费用降价 50%:现价 5 元 / 1M tokens / min
2024-08-07 15:30:36
万亿参数Kimi K2开源,月之暗面研发工程师知乎亲述幕后故事
2025-07-15 10:40:09
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
DeepSeek风暴里的月之暗面
2025-02-15 14:05:11
月之暗面 Kimi 创始人杨植麟:中国技术不仅要好用还要参与制定规则,未来大模型要推出到 K100
2026-01-12 09:22:11
Kimi罗生门:创始人、投资人,谁的错?
2024-11-15 17:29:08
月之暗面收缩投放 知情人士称近期自然新增用户量增长
2025-02-18 18:33:47
695 文章
565871 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17