1月29日,阿里开源千问语音识别模型Qwen3-ASR系列,性能达开源最佳(SOTA),直逼顶级闭源模型。该模型支持52种语言与方言,可精准识别语速快的饶舌RAP歌曲,并在10秒内处理5小时音频。此次开源包括1.7B和0.6B两个版本,前者准确率极高,后者效率与性能平衡,适合端侧部署。Qwen3-ASR在中文、英文及方言识别上领先GPT-4o等闭源API,方言错误率比Doubao-ASR低20%。此外,阿里还开源了语音强制对齐模型Qwen3-ForcedAligner-0.6B及推理框架,加速产业落地。截至目前,阿里已开源400余个模型,千问家族全球下载超10亿,衍生模型超20万,采用率达53%,位居全球第一。
原文链接
本文链接:https://kx.umi6.com/article/32352.html
转载请注明文章出处
相关推荐
换一换
通义千问最新AI编程大模型Qwen3-Coder正式开源
2025-07-23 07:45:34
AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍
2025-11-05 18:16:46
兑现承诺!马斯克旗下xAI宣布Grok 2.5正式开源
2025-08-25 16:33:11
腾讯智能体开源大动作!关键技术都拿出来了,开发平台还全面升级
2025-09-22 12:58:11
京东云开源JoyAgent智能体
2025-07-26 10:36:52
消息称 Meta 正讨论放弃开源 AI 模型 Behemoth,转向闭源战略
2025-07-15 15:46:36
小米首席语音科学家 Daniel Povey:AI 发展的本质就像生物进化,不开源要慢 1000 倍
2025-12-15 16:49:04
马斯克罕见低头:开源????推荐算法,自嘲“很烂”不过未来月更
2026-01-21 13:07:44
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹
2025-10-11 16:31:47
小米全面开源具身大模型MiMo-Embodied
2025-11-21 21:43:50
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
760 文章
494598 浏览
24小时热文
更多
-
2026-01-30 22:53:26 -
2026-01-30 22:51:57 -
2026-01-30 21:49:41