9月19日,小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio。该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并观察到明显的“涌现”行为。在多项标准评测中,MiMo-Audio表现优异:在音频理解基准MMAU测试集中超越Google闭源模型Gemini-2.5-Flash;在Big Bench Audio S2T任务中超越OpenAI的GPT-4o-Audio-Preview,同时在通用语音理解和对话等任务中取得7B参数量最佳性能,大幅领先同级别开源模型。
原文链接
本文链接:https://kx.umi6.com/article/25501.html
转载请注明文章出处
相关推荐
换一换
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025-12-01 15:15:24
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
小米或进军AI教育领域 正招聘多个相关岗位 聚焦多终端K12教育方向
2025-12-10 11:44:24
小米发布 Miloco 智能家居未来探索方案,对全社会开放
2025-11-14 15:02:49
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……
2025-11-04 12:11:12
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
昆仑万维发布并开源Matrix-Game 2.0模型
2025-08-12 10:17:03
消息称小米研发智能问答助手产品“Mi Chat”
2025-12-09 17:51:08
小米自研 MINT 统一模型部署平台发布:降低 AI 开发门槛,优先向生态链公司开放
2025-12-17 12:41:00
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
2025-11-11 18:20:16
华为UCM推理记忆管理技术正式开源
2025-11-05 16:17:45
644 文章
412783 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55