9月19日,小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio。该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并观察到明显的“涌现”行为。在多项标准评测中,MiMo-Audio表现优异:在音频理解基准MMAU测试集中超越Google闭源模型Gemini-2.5-Flash;在Big Bench Audio S2T任务中超越OpenAI的GPT-4o-Audio-Preview,同时在通用语音理解和对话等任务中取得7B参数量最佳性能,大幅领先同级别开源模型。
原文链接
本文链接:https://kx.umi6.com/article/25501.html
转载请注明文章出处
相关推荐
换一换
卢伟冰回应罗福莉加入小米及未来 AI 新战略:不能透露太多,但小米在大模型应用方面进展远超预期
2025-12-04 11:14:44
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
小米发布 Miloco 智能家居未来探索方案,对全社会开放
2025-11-14 15:02:49
Databricks 呼吁美国 AI 行业拥抱开源:这是中国能够领先的关键因素
2025-11-15 15:55:27
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
年薪千万!雷军亲自挖人 95后AI天才少女罗福莉宣布入职小米
2025-11-12 14:07:52
英伟达开源9B参数小模型,比Qwen3快6倍
2025-08-19 16:03:42
Hugging Face 桌面机器人 Reachy Mini 开订:长相呆萌,支持超 170 万个 AI 模型
2025-07-09 16:06:14
通义千问最新AI编程大模型Qwen3-Coder正式开源
2025-07-23 07:45:34
AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍
2025-11-05 18:16:46
智谱董事长刘德兵:完全支持开源,我们已开源 40 多款 AI 模型
2025-11-16 11:28:16
OpenAI发布GPT-realtime语音对话模型
2025-08-29 08:37:51
600 文章
338811 浏览
24小时热文
更多
-
2025-12-08 20:48:29 -
2025-12-08 20:47:34 -
2025-12-08 20:45:30