9月19日,小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio。该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并观察到明显的“涌现”行为。在多项标准评测中,MiMo-Audio表现优异:在音频理解基准MMAU测试集中超越Google闭源模型Gemini-2.5-Flash;在Big Bench Audio S2T任务中超越OpenAI的GPT-4o-Audio-Preview,同时在通用语音理解和对话等任务中取得7B参数量最佳性能,大幅领先同级别开源模型。
原文链接
本文链接:https://kx.umi6.com/article/25501.html
转载请注明文章出处
相关推荐
换一换
蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0
2025-12-12 15:57:42
小米自研 MINT 统一模型部署平台发布:降低 AI 开发门槛,优先向生态链公司开放
2025-12-17 12:41:00
智谱开源GLM-OCR模型
2026-02-03 09:27:36
卢伟冰回应罗福莉加入小米及未来 AI 新战略:不能透露太多,但小米在大模型应用方面进展远超预期
2025-12-04 11:14:44
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
面壁智能 AgentCPM-Explore 小模型开源:仅 4B 参数,挑战端侧智能体部署
2026-01-14 15:42:31
阶跃星辰语音模型登顶全球第一
2026-01-15 10:31:06
国产AI已接近Opus性能 MiniMax 开源后引发争议:严禁商业用途
2026-04-13 12:59:51
千问语音识别模型Qwen3-ASR开源!饶舌RAP歌曲也能轻松识别
2026-01-30 11:21:16
智谱开源GLM-4.7-Flash模型
2026-01-20 16:17:32
全球首个医疗视频理解大模型开源!6k+组精标测试集与英雄榜同步上线,开发者速来!
2026-04-26 14:16:11
Claude封杀龙虾后推自家Agent服务,又被开源平替了
2026-04-09 15:12:47
13款手机AI比拼 小米拿下金牌!
2025-10-27 18:12:32
744 文章
649929 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41