1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年8月4日,小米正式发布自研声音理解大模型 MiDashengLM-7B,并全量开源。该模型在速度和精度上实现双突破,单样本首 Token 延迟仅为同类模型的1/4,同显存下并发超20倍,在22个公开评测集上刷新多模态大模型的最佳成绩(SOTA)。MiDashengLM-7B基于 Xiaomi Dasheng 音频编码器与 Qwen2.5-Omni-7B Thinker 解码器,通过创新训练策略统一理解语音、环境声与音乐,已应用于智能家居、汽车座舱等30多项场景。模型训练数据完全公开,采用宽松的 Apache License 2.0 协议支持学术和商业应用。小米正进一步优化其计算效率,目标实现终端设备离线部署及更全面的声音编辑功能。开源地址和Demo已同步上线。

原文链接
本文链接:https://kx.umi6.com/article/22949.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
小米声音理解大模型 MiDashengLM-7B 发布并全量开源,22 个公开评测集刷新最好成绩
2025-08-04 11:54:48
B站持续完善海外用户产品体验,用户可体验原汁原味多语种视频
2025-08-01 18:04:22
OpenAI 董事长布莱特・泰勒力挺计算机科学专业:能掌握的远不止编程语言
2025-08-02 18:23:34
拥抱潘多拉,但按住盒子
2025-08-01 19:06:41
你在为Figma上市欢呼,Figma可不敢为AI狂欢
2025-08-02 11:16:32
凝聚开源共识,第三届杭州产投融生态大会在杭召开
2025-08-01 18:05:33
刚刚,智元机器人又融资了
2025-08-01 18:06:03
扎克伯格认输了,但他将用AI填满人类的空闲时间!
2025-08-02 23:26:48
360 纳米 AI 升级为首个“多智能体蜂群”,一句话即可生成 10 分钟“电影级”大片
2025-08-02 23:25:41
OpenAI迎来“Agent时刻”:智能体大战的路线选择
2025-08-04 10:53:21
大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准
2025-08-01 19:06:23
百度聚焦,心响失宠
2025-08-03 11:35:24
纳米AI多智能体蜂群上线。一句话生成大片
2025-08-02 22:27:30
24小时热文
更多
扫一扫体验小程序