4月30日,小米开源首个“为推理而生”的大模型Xiaomi MiMo。该模型由小米大模型Core团队开发,仅用7B参数规模,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)中超越了OpenAI的o1-mini及阿里Qwen的QwQ-32B-Preview。MiMo的推理能力提升得益于预训练和后训练阶段的数据与算法创新。预训练阶段通过挖掘富推理语料合成200B tokens数据,并进行三阶段训练,总计25T tokens;后训练阶段采用Test Difficulty Driven Reward算法缓解奖励稀疏问题,引入Easy Data Re-Sampling策略稳定RL训练,同时设计Seamless Rollout系统加速RL和验证过程。MiMo已在Hugging Face和GitHub上开源,技术报告同步发布。
原文链接
本文链接:https://kx.umi6.com/article/17974.html
转载请注明文章出处
相关推荐
.png)
换一换
IDC评测9家座舱大模型产品 斑马获最多项满分推荐
2025-07-18 11:36:59
大模型呼唤开源多模态 AI加速冲刺物理世界
2025-06-07 14:50:49
实测豆包1.6,最火玩法all in one!Seedance登顶视频生成榜一
2025-06-12 16:35:13
447 文章
69882 浏览
24小时热文
更多

-
2025-07-19 15:54:36
-
2025-07-19 15:54:26
-
2025-07-19 14:57:21