1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月30日,小米开源首个“为推理而生”的大模型Xiaomi MiMo。该模型由小米大模型Core团队开发,仅用7B参数规模,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)中超越了OpenAI的o1-mini及阿里Qwen的QwQ-32B-Preview。MiMo的推理能力提升得益于预训练和后训练阶段的数据与算法创新。预训练阶段通过挖掘富推理语料合成200B tokens数据,并进行三阶段训练,总计25T tokens;后训练阶段采用Test Difficulty Driven Reward算法缓解奖励稀疏问题,引入Easy Data Re-Sampling策略稳定RL训练,同时设计Seamless Rollout系统加速RL和验证过程。MiMo已在Hugging Face和GitHub上开源,技术报告同步发布。

原文链接
本文链接:https://kx.umi6.com/article/17974.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
2025-09-03 17:49:26
英伟达新研究:小模型才是智能体的未来
2025-08-19 08:54:39
商汤需要「网感」
2025-07-09 13:03:03
用DeepSeek改造ERP,到底难在哪?怎么破?
2025-10-11 09:33:30
高性能计算群星闪耀时
2025-08-21 12:35:24
上海出台17条措施促进软信业发展 优质大模型应用最高给予30%补助
2025-07-07 20:36:05
卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度
2025-08-17 12:35:45
我国首个发电行业大模型“擎源”发布,模型参数达千亿级别
2025-06-28 20:23:24
OpenAI:智谱在海外市场取得了显著进展,是大模型领域的新锐代表
2025-06-30 19:46:02
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
1万tokens是检验长文本的新基准,超过后18款大模型集体失智
2025-07-17 15:23:24
消费电子将被大模型重新定义?云天励飞董事长陈宁:看好推理算力需求的爆发 全面押注AI芯片
2025-07-25 11:23:59
阿里巴巴CEO吴泳铭:大模型是下一代操作系统 AI Cloud是下一代计算机
2025-09-24 10:37:04
24小时热文
更多
扫一扫体验小程序