10月14日,小米与北京大学联合发表一篇AI论文,通讯作者之一是被曝获雷军千万年薪挖角的DeepSeek“天才少女”罗福莉。论文提出一种名为Rollout Routing Replay(R3)的新方法,用于提升MoE模型在强化学习训练中的稳定性和性能。研究显示,R3显著缩小了训练和推理间的差异,KL散度降低一个量级,且避免了训练崩溃问题。罗福莉曾参与DeepSeek-V2研发,但论文未标注其隶属于小米团队。这一成果为解决MoE模型训练不稳定性提供了新思路,可能对多轮对话和Agent任务场景有重要应用价值。
原文链接
本文链接:https://kx.umi6.com/article/26761.html
转载请注明文章出处
相关推荐
换一换
前DeepSeek研究员罗福莉已加入小米:全力奔赴心目中的AGI
2025-11-12 14:08:59
被雷军千万年薪挖角的罗福莉已到新岗位 小米内部员工系统暂无信息
2025-02-18 17:27:41
罗福莉加入小米后首秀,解释 MiMo-V2-Flash 模型如何做到推理速度飞快
2025-12-17 11:39:04
雷军“三十顾茅庐”求的人才,来了
2025-02-20 15:20:49
DeepSeek刷屏论文背后:除了梁文锋,还有一个18岁中国高中生,曾写出神级提示词
2025-09-19 11:14:40
卢伟冰回应罗福莉加入小米及未来 AI 新战略:不能透露太多,但小米在大模型应用方面进展远超预期
2025-12-04 11:14:44
曾被雷军千万年薪挖角 曝天才少女罗福莉已到新岗位上班
2025-02-18 01:02:43
小米最新大模型成果!罗福莉现身了
2025-10-17 16:21:28
年薪千万!雷军亲自挖人 95后AI天才少女罗福莉宣布入职小米
2025-11-12 14:07:52
罗福莉首个小米成果!开源具身大模型
2025-11-22 16:22:47
罗福莉首秀,雷军的AI新战事
2025-12-18 11:39:07
罗福莉将以小米MiMo大模型负责人身份亮相小米生态大会
2025-11-19 20:37:39
小米 AI 新论文,雷军千万年薪要挖的 DeepSeek“天才少女”罗福莉署名
2025-10-16 13:53:15
612 文章
389631 浏览
24小时热文
更多
-
2025-12-19 14:57:10 -
2025-12-19 14:56:10 -
2025-12-19 14:56:05