1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

《科创板日报》报道,月之暗面Kimi发布新技术报告,推出‘Moonlight’模型,该模型基于Muon训练,参数量分别为30亿和160亿。使用了5.7万亿个token进行训练,在较低的浮点运算次数下实现更优性能,提升了帕累托效率边界。

原文链接
本文链接:https://kx.umi6.com/article/14143.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
月之暗面因 DeepSeek 调整工作重心?内部人士:强化学习或许会是个方向
2025-02-15 18:07:16
月之暗面 Kimi 开放平台上下文缓存 Cache 存储费用降价 50%:现价 5 元 / 1M tokens / min
2024-08-07 15:30:36
月之暗面开源Moonlight:30亿/160亿参数混合专家模型
2025-02-24 09:20:48
24小时热文
更多
扫一扫体验小程序