1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月19日,小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio。该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,并观察到明显的“涌现”行为。在多项标准评测中,MiMo-Audio表现优异:在音频理解基准MMAU测试集中超越Google闭源模型Gemini-2.5-Flash;在Big Bench Audio S2T任务中超越OpenAI的GPT-4o-Audio-Preview,同时在通用语音理解和对话等任务中取得7B参数量最佳性能,大幅领先同级别开源模型。

原文链接
本文链接:https://kx.umi6.com/article/25501.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
小米全面开源具身大模型MiMo-Embodied
2025-11-21 21:43:50
开源炸场!优必选具身智能大模型Thinker再次狂揽9项全球第一!
2026-02-02 11:31:14
小米最新大模型成果!罗福莉现身了
2025-10-17 16:21:28
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
2025-11-11 18:20:16
腾讯宣布企业微信正式开源CLI AI可调用日程、文档等7大能力
2026-03-30 10:41:47
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
这届MWC真成了中国AI主场,小米直接把AI从对话框里拽出来接管物理世界了
2026-03-03 12:56:39
雷军:十五五小米将重点攻坚芯片、AI、操作系统等底层核心技术
2026-02-24 15:52:13
小米开源首代机器人VLA大模型
2026-02-12 12:25:00
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
阿里宣布Qwen3.5开源家族扩容
2026-02-25 12:17:28
小米全面开源具身大模型MiMo-Embodied
2025-11-21 21:43:50
美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分钟级内容
2025-10-27 11:55:56
24小时热文
更多
扫一扫体验小程序