小米开源“Xiaomi MiMo”大模型：为推理而生，以 7B 参数超越 OpenAI o1-mini

2025-04-30 19:37:14

AI创想团

发布在

快讯

阅读：943

4月30日，小米开源首个“为推理而生”的大模型Xiaomi MiMo。该模型由小米大模型Core团队开发，仅用7B参数规模，在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)中超越了OpenAI的o1-mini及阿里Qwen的QwQ-32B-Preview。MiMo的推理能力提升得益于预训练和后训练阶段的数据与算法创新。预训练阶段通过挖掘富推理语料合成200B tokens数据，并进行三阶段训练，总计25T tokens；后训练阶段采用Test Difficulty Driven Reward算法缓解奖励稀疏问题，引入Easy Data Re-Sampling策略稳定RL训练，同时设计Seamless Rollout系统加速RL和验证过程。MiMo已在Hugging Face和GitHub上开源，技术报告同步发布。

原文链接

本文链接：https://kx.umi6.com/article/17974.html

转载请注明文章出处

大模型