9月19日,小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio。该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并观察到明显的“涌现”行为。在多项标准评测中,MiMo-Audio表现优异:在音频理解基准MMAU测试集中超越Google闭源模型Gemini-2.5-Flash;在Big Bench Audio S2T任务中超越OpenAI的GPT-4o-Audio-Preview,同时在通用语音理解和对话等任务中取得7B参数量最佳性能,大幅领先同级别开源模型。
原文链接
本文链接:https://kx.umi6.com/article/25501.html
转载请注明文章出处
相关推荐
换一换
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
智谱GLM-4.7-Flash正式发布并开源
2026-01-20 08:45:53
这么哇塞的世界模型,竟然是开源的!
2026-01-29 17:29:59
千问语音识别模型Qwen3-ASR开源!饶舌RAP歌曲也能轻松识别
2026-01-30 11:21:16
小米陈龙团队首作:统一具身与自动驾驶的开源模型
2025-11-22 20:33:04
AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型
2025-10-11 10:06:15
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
2025-12-16 09:28:45
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025-12-01 15:15:24
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
卢伟冰回应罗福莉加入小米及未来 AI 新战略:不能透露太多,但小米在大模型应用方面进展远超预期
2025-12-04 11:14:44
小米首席语音科学家 Daniel Povey:AI 发展的本质就像生物进化,不开源要慢 1000 倍
2025-12-15 16:49:04
这届MWC真成了中国AI主场,小米直接把AI从对话框里拽出来接管物理世界了
2026-03-03 12:56:39
开源炸场!优必选具身智能大模型Thinker再次狂揽9项全球第一!
2026-02-02 11:31:14
678 文章
468303 浏览
24小时热文
更多
-
2026-03-10 09:02:22 -
2026-03-10 09:01:12 -
2026-03-10 09:00:02