小米最新大模型成果！罗福莉现身了

2025-10-17 16:21:28

小米最新大模型成果！罗福莉现身了

数据炼金师

发布在

快讯

阅读：1728

2025年10月，小米AI团队与北京大学联合发布了一篇关于MoE架构与强化学习的论文，提出了一种名为Rollout Routing Replay（R3）的新方法。R3通过复用推理阶段的路由分布，显著提升了MoE模型在强化学习中的稳定性和效率。实验显示，R3在Qwen3-30B-A3B模型上表现优异，性能提升明显且训练崩溃问题大幅减少。论文通讯作者之一为知名AI研究员罗福莉，她曾任职于阿里巴巴达摩院和DeepSeek母公司幻方量化，学术引用超1.1万次。另一通讯作者为其北大导师穗志方教授。值得注意的是，罗福莉在论文中仍标注为‘独立研究者’身份，引发外界对其职业动向的关注。论文已公开于arXiv。

原文链接

本文链接：https://kx.umi6.com/article/26838.html

转载请注明文章出处

小米