4月30日,小米开源首个专为推理设计的大模型「Xiaomi MiMo」。在AIME和LiveCodeBench评测中,MiMo仅用7B参数规模,就超越了OpenAI的o1-mini和阿里更大型号QwQ-32B-Preview。MiMo通过预训练和后训练结合的方式提升推理能力,预训练阶段生成约200B tokens推理数据,训练总量达25T tokens;后训练采用创新算法和框架,使RL训练速度提升2.29倍。MiMo已在HuggingFace开源,其技术细节也在GitHub公布。这是小米大模型Core团队的首次尝试,标志着AGI探索的持续努力。
原文链接
本文链接:https://kx.umi6.com/article/18029.html
转载请注明文章出处
相关推荐
换一换
腾讯智能体框架 Youtu-Agent 开源,搭建 Agent 只需两步
2025-09-02 16:34:48
大模型开源后如何投资AI? 顶级创投看好中国企业“换道超车”的机会
2025-08-01 13:02:40
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
2025-06-06 22:39:37
GitHub一周2000星!国产统一图像生成模型神器升级,理解质量双up,还学会了“反思”
2025-07-03 13:21:28
不玩噱头的北京,用数据和实力成就「全球开源之都」
2025-05-20 20:44:53
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
腾讯混元开源视频音效生成模型
2025-08-28 16:29:54
腾讯开源混元 3D 2.1 大模型:首个全链路开源工业级 3D 生成大模型,PC 也能“跑”
2025-06-14 07:22:03
鹅厂开源视频生成大杀器!参考图主体精准复刻,还能编辑现有视频
2025-05-09 21:57:02
Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑
2025-05-30 14:54:04
腾讯智能体开源大动作!关键技术都拿出来了,开发平台还全面升级
2025-09-22 12:58:11
阶跃星辰开源 3D 大模型 Step1X-3D,可生成高保真、可控的 3D 内容
2025-05-14 17:24:10
小扎自曝挖人秘诀:小团队我亲自带,豪掷数百亿建GW集群,大家不图天价薪酬只为“造神”
2025-07-15 13:42:34
531 文章
239955 浏览
24小时热文
更多
-
2025-10-24 19:49:44 -
2025-10-24 18:49:31 -
2025-10-24 18:49:20