4月30日,小米开源首个“为推理而生”的大模型Xiaomi MiMo。该模型由小米大模型Core团队开发,仅用7B参数规模,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)中超越了OpenAI的o1-mini及阿里Qwen的QwQ-32B-Preview。MiMo的推理能力提升得益于预训练和后训练阶段的数据与算法创新。预训练阶段通过挖掘富推理语料合成200B tokens数据,并进行三阶段训练,总计25T tokens;后训练阶段采用Test Difficulty Driven Reward算法缓解奖励稀疏问题,引入Easy Data Re-Sampling策略稳定RL训练,同时设计Seamless Rollout系统加速RL和验证过程。MiMo已在Hugging Face和GitHub上开源,技术报告同步发布。
原文链接
本文链接:https://kx.umi6.com/article/17974.html
转载请注明文章出处
相关推荐
换一换
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1
2025-11-18 14:20:39
华人AI大神霸气离职,一篇博客挑明中美大模型暗战
2025-10-11 10:14:30
智谱中标679.8万元水电大模型项目
2025-11-05 20:23:03
中国企业调用大模型日均达37万亿tokens
2026-02-24 13:54:18
阿里巴巴CEO吴泳铭:大模型是下一代操作系统 AI Cloud是下一代计算机
2025-09-24 10:37:04
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
大模型即OS,AI云即计算机:阿里的全栈赌注
2025-09-25 10:00:29
建议你不要再相信AI基准测试,排行榜已经没啥公信力了
2025-12-04 12:18:33
亚马逊云科技发布多款大模型
2025-12-03 14:25:54
花3000元让AI改口,大模型的尽头是广告?
2026-01-06 19:29:29
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
马年4大顶流模型会师阿里云Coding Plan开工!Token量大管饱,自由切换真香
2026-02-26 00:01:12
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
690 文章
482659 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18