1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月30日,小米开源首个“为推理而生”的大模型Xiaomi MiMo。该模型由小米大模型Core团队开发,仅用7B参数规模,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)中超越了OpenAI的o1-mini及阿里Qwen的QwQ-32B-Preview。MiMo的推理能力提升得益于预训练和后训练阶段的数据与算法创新。预训练阶段通过挖掘富推理语料合成200B tokens数据,并进行三阶段训练,总计25T tokens;后训练阶段采用Test Difficulty Driven Reward算法缓解奖励稀疏问题,引入Easy Data Re-Sampling策略稳定RL训练,同时设计Seamless Rollout系统加速RL和验证过程。MiMo已在Hugging Face和GitHub上开源,技术报告同步发布。

原文链接
本文链接:https://kx.umi6.com/article/17974.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大模型即OS,AI云即计算机:阿里的全栈赌注
2025-09-25 10:00:29
持续霸榜!阿里千问3.6Plus问鼎全球大模型调用周榜冠军
2026-04-07 12:52:26
腾讯发布全新大模型混元3D 3.0
2025-09-16 10:11:57
用DeepSeek改造ERP,到底难在哪?怎么破?
2025-10-11 09:33:30
Kimi春节档挣超一年钱!这口“龙虾肉”大厂开始抢吃了
2026-02-26 01:05:27
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
美图吴欣鸿回应大模型竞争:美图应用数据仍在快速增长
2026-02-05 18:05:31
小米MiMo大模型首次推出Token Plan,单次订阅可满足全模态Agent任务需求
2026-04-03 14:21:37
你用的大模型是什么MBTI?
2025-09-23 20:23:14
Gartner首次发布大模型报告:火山引擎排名中国厂商第一
2025-11-20 12:17:36
ToC智能体火得快,但更大的价值在企业丨中关村科金@MEET2026
2025-12-12 14:53:17
DeepSeek V3.2、GLM4.6等大模型即将发布
2025-09-29 17:14:30
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
24小时热文
更多
扫一扫体验小程序