1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月30日,小米开源首个专为推理设计的大模型「Xiaomi MiMo」。在AIME和LiveCodeBench评测中,MiMo仅用7B参数规模,就超越了OpenAI的o1-mini和阿里更大型号QwQ-32B-Preview。MiMo通过预训练和后训练结合的方式提升推理能力,预训练阶段生成约200B tokens推理数据,训练总量达25T tokens;后训练采用创新算法和框架,使RL训练速度提升2.29倍。MiMo已在HuggingFace开源,其技术细节也在GitHub公布。这是小米大模型Core团队的首次尝试,标志着AGI探索的持续努力。

原文链接
本文链接:https://kx.umi6.com/article/18029.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
2700GB高质量数据,训出空间智能SOTA,背后秘诀全栈开源
2026-03-31 14:51:34
用编程大模型登顶开源第一后,智谱GLM团队被拷问了3小时
2025-12-25 11:29:48
阿里千问开源Qwen3-Coder-Next模型
2026-02-04 08:31:48
X 平台正式开源推荐算法,马斯克称没有其他社交媒体公司这样做
2026-01-20 14:10:44
智谱 GLM-4.7-Flash 模型发布并开源,可免费调用
2026-01-20 09:47:20
开源Agent模型榜第一名,现在是阿里通义DeepResearch
2025-09-18 15:54:31
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
小米MiMo大模型负责人罗福莉:AI通过“自进化”创造新东西
2026-03-27 17:14:18
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
DeepSeek V4报告太详尽了!484天换代之路全公开
2026-04-25 12:10:04
蚂蚁灵波开源具身大模型LingBot-VLA,让机器人“看的更清楚 做的更明白”
2026-01-28 11:08:15
通义万相全新动作生成模型开源
2025-09-19 15:17:03
24小时热文
更多
扫一扫体验小程序