1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年8月4日,小米正式发布自研声音理解大模型 MiDashengLM-7B,并全量开源。该模型在速度和精度上实现双突破,单样本首 Token 延迟仅为同类模型的1/4,同显存下并发超20倍,在22个公开评测集上刷新多模态大模型的最佳成绩(SOTA)。MiDashengLM-7B基于 Xiaomi Dasheng 音频编码器与 Qwen2.5-Omni-7B Thinker 解码器,通过创新训练策略统一理解语音、环境声与音乐,已应用于智能家居、汽车座舱等30多项场景。模型训练数据完全公开,采用宽松的 Apache License 2.0 协议支持学术和商业应用。小米正进一步优化其计算效率,目标实现终端设备离线部署及更全面的声音编辑功能。开源地址和Demo已同步上线。

原文链接
本文链接:https://kx.umi6.com/article/22949.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
小米声音理解大模型 MiDashengLM-7B 发布并全量开源,22 个公开评测集刷新最好成绩
2025-08-04 11:54:48
小米开源声音理解大模型MiDashengLM-7B
2025-08-04 22:07:27
阿里巴巴助推亚洲可转换债券9月飙升创纪录
2025-10-02 18:20:05
机器人化身景区“引流利器”!无锡解锁全国首家具身智能体验中心
2025-10-01 18:49:45
宇树科技回应机器人存安全漏洞:已完成大部分修复工作,将在不久后推送更新
2025-09-30 16:30:22
AI 教父约书亚・本吉奥:超智能 AI 或有“自我保护目标”,人类十年内恐面临灭绝风险
2025-10-02 11:10:00
Hugging Face 联合创始人沃尔夫:当前的 AI 模型不太可能带来重大科学突破
2025-10-02 16:17:29
首次实现第一视角视频与人体动作同步生成!新框架攻克视角-动作对齐两大技术壁垒
2025-10-01 10:41:43
微软为 Copilot 添加动画形象,提升 AI 助手交互亲和力
2025-10-01 09:40:13
盯上AI版抖音的奥特曼,先得搞定皮卡丘
2025-10-02 16:19:49
AI基础设施REIT公司Fermi提高IPO规模 拟筹资6.5亿美元
2025-09-30 16:33:51
真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强
2025-09-30 17:30:07
上海率先实现生成式人工智能服务备案、登记“双破百”
2025-09-30 22:33:47
24小时热文
更多
扫一扫体验小程序