9月19日,小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio。该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并观察到明显的“涌现”行为。在多项标准评测中,MiMo-Audio表现优异:在音频理解基准MMAU测试集中超越Google闭源模型Gemini-2.5-Flash;在Big Bench Audio S2T任务中超越OpenAI的GPT-4o-Audio-Preview,同时在通用语音理解和对话等任务中取得7B参数量最佳性能,大幅领先同级别开源模型。
原文链接
本文链接:https://kx.umi6.com/article/25501.html
转载请注明文章出处
相关推荐
.png)
换一换
小米自研芯片,争论背后
2025-05-26 12:37:00
腾讯发布混元3D世界模型1.0:首个支持物理仿真的开源世界生成系统
2025-08-01 09:00:10
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
百度文心大模型4.5系列正式开源 同步开放API服务
2025-06-30 11:47:18
京东云开源JoyAgent智能体
2025-07-26 10:36:52
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了
2025-05-20 18:43:16
蚂蚁集宣布正式开源统一多模态大模型Ming-lite-omni
2025-05-29 12:28:01
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
2025-08-24 10:10:55
三家混战,大模型重回2023
2025-08-03 11:35:50
Meta、微软掌门人最新对谈:AI浪潮带来软件开发革命
2025-05-07 16:17:03
小扎自曝挖人秘诀:小团队我亲自带,豪掷数百亿建GW集群,大家不图天价薪酬只为“造神”
2025-07-15 13:42:34
AI这场仗,蚂蚁决定这么打
2025-05-28 19:17:40
517 文章
191067 浏览
24小时热文
更多

-
2025-09-19 14:13:12
-
2025-09-19 14:12:58
-
2025-09-19 13:13:56