4月30日,小米开源首个“为推理而生”的大模型Xiaomi MiMo。该模型由小米大模型Core团队开发,仅用7B参数规模,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)中超越了OpenAI的o1-mini及阿里Qwen的QwQ-32B-Preview。MiMo的推理能力提升得益于预训练和后训练阶段的数据与算法创新。预训练阶段通过挖掘富推理语料合成200B tokens数据,并进行三阶段训练,总计25T tokens;后训练阶段采用Test Difficulty Driven Reward算法缓解奖励稀疏问题,引入Easy Data Re-Sampling策略稳定RL训练,同时设计Seamless Rollout系统加速RL和验证过程。MiMo已在Hugging Face和GitHub上开源,技术报告同步发布。
原文链接
本文链接:https://kx.umi6.com/article/17974.html
转载请注明文章出处
相关推荐
换一换
亚马逊云科技发布多款大模型
2025-12-03 14:25:54
华人AI大神霸气离职,一篇博客挑明中美大模型暗战
2025-10-11 10:14:30
月之暗面 Kimi 创始人杨植麟:中国技术不仅要好用还要参与制定规则,未来大模型要推出到 K100
2026-01-12 09:22:11
上海:推动医疗器械相关垂类大模型研发应用
2025-09-15 16:02:14
智谱、MiniMax争夺「大模型第一股」
2025-12-24 10:30:23
人类正在被AI「幻觉」欺骗
2025-08-20 10:10:57
长三角一体化大模型发布 AI将为区域发展提供决策支撑
2026-01-12 09:40:07
智谱与市城投集团合作发布杭州城投人工智能产业大模型项目(一期)建设成果
2025-09-15 20:01:43
建议你不要再相信AI基准测试,排行榜已经没啥公信力了
2025-12-04 12:18:33
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
开源 AI 模型 TOP5,被中国厂商包圆
2025-10-15 18:39:57
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
2025-09-03 17:49:26
百度新设两个大模型研发部:直接向CEO李彦宏汇报!
2025-11-25 22:10:22
659 文章
427525 浏览
24小时热文
更多
-
2026-01-20 23:34:12 -
2026-01-20 22:36:00 -
2026-01-20 22:34:54