1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

《科创板日报》报道,月之暗面Kimi发布新技术报告,推出‘Moonlight’模型,该模型基于Muon训练,参数量分别为30亿和160亿。使用了5.7万亿个token进行训练,在较低的浮点运算次数下实现更优性能,提升了帕累托效率边界。

原文链接
本文链接:https://kx.umi6.com/article/14143.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent
2025-06-23 09:22:20
杨植麟还没有解开月之暗面的局
2024-11-21 08:25:43
月之暗面或启动新一轮融资 估值将达40亿美元
2025-11-21 21:44:55
月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%
2025-11-27 16:43:04
留给杨植麟“排雷”的时间不多了
2024-12-11 16:30:42
月之暗面宣布:上下文缓存Cache存储费用降价50%
2024-08-07 14:29:59
大砍投放预算,DeepSeek冲击之下月之暗面暂缓“烧钱”
2025-02-18 17:30:55
朱啸虎炮轰:张予彤故意欺骗免费拿月之暗面14%创始股份,已被金沙江解雇
2024-12-05 12:01:44
DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库
2025-02-25 12:00:43
月之暗面再获融资!200亿估值会成为中国大模型公司的门槛和陷阱吗?
2024-08-16 06:10:50
月之暗面发布数学大模型,对标OpenAI o1
2024-11-21 16:37:48
Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能较 HGX 200 提升 10 倍
2025-12-04 12:20:54
月之暗面仲裁风波非个例 一级市场“信义义务”引重视|K时评
2024-12-17 11:07:14
24小时热文
更多
扫一扫体验小程序