9月19日,小米宣布开源首个原生端到端语音大模型Xiaomi-MiMo-Audio,首次在语音领域实现基于ICL的少样本泛化。该模型通过创新预训练架构和上亿小时数据,在自然度、情感表达和交互适配方面达到拟人化水准。其突破性创新包括:证明语音无损压缩预训练可“涌现”跨任务泛化性,并开源完整语音预训练方案,包括Tokenizer、模型结构等。目前,模型已在Huggingface和Github平台开源,参数量达1.2B,支持音频重建和音频转文本任务。
原文链接
本文链接:https://kx.umi6.com/article/25508.html
转载请注明文章出处
相关推荐
.png)
换一换
字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
2025-07-26 15:40:54
给Manus七分钟,它可以做什么
2025-05-19 22:24:28
中国AI 大厂,被Deepseek 掀了牌桌之后
2025-05-19 13:16:00
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
GitHub一周2000星!国产统一图像生成模型神器升级,理解质量双up,还学会了“反思”
2025-07-03 13:21:28
Meta Llama AI 模型下载量突破 12 亿,开发者贡献数万个衍生模型
2025-04-30 19:43:33
小扎自曝挖人秘诀:小团队我亲自带,豪掷数百亿建GW集群,大家不图天价薪酬只为“造神”
2025-07-15 13:42:34
兑现承诺!马斯克旗下xAI宣布Grok 2.5正式开源
2025-08-25 16:33:11
Meta、微软掌门人最新对谈:AI浪潮带来软件开发革命
2025-05-07 16:17:03
AMD甩出最猛两代AI芯片,算力飙涨、豪气堆料
2025-06-13 12:08:30
人形机器人:最初的设想,最后的归宿
2025-04-22 08:09:04
阿里云创始人王坚:人工智能时代将带来“计算卫星”
2025-09-11 15:59:12
Hugging Face 桌面机器人 Reachy Mini 开订:长相呆萌,支持超 170 万个 AI 模型
2025-07-09 16:06:14
558 文章
186860 浏览
24小时热文
更多

-
2025-09-19 14:14:34
-
2025-09-19 14:13:12
-
2025-09-19 14:12:58