1月29日,阿里开源千问语音识别模型Qwen3-ASR系列,性能达开源最佳(SOTA),直逼顶级闭源模型。该模型支持52种语言与方言,可精准识别语速快的饶舌RAP歌曲,并在10秒内处理5小时音频。此次开源包括1.7B和0.6B两个版本,前者准确率极高,后者效率与性能平衡,适合端侧部署。Qwen3-ASR在中文、英文及方言识别上领先GPT-4o等闭源API,方言错误率比Doubao-ASR低20%。此外,阿里还开源了语音强制对齐模型Qwen3-ForcedAligner-0.6B及推理框架,加速产业落地。截至目前,阿里已开源400余个模型,千问家族全球下载超10亿,衍生模型超20万,采用率达53%,位居全球第一。
原文链接
本文链接:https://kx.umi6.com/article/32352.html
转载请注明文章出处
相关推荐
换一换
真如摄影、细至发丝!阿里开源新一代图像生成模型Qwen-Image
2025-12-31 21:40:29
阶跃StepAudio 2.5 ASR上线 支持500TPS极速推理
2026-04-24 14:19:56
开源炸场!优必选具身智能大模型Thinker再次狂揽9项全球第一!
2026-02-02 11:31:14
连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹
2025-10-11 16:31:47
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025-12-01 15:15:24
智谱开源GLM-4.7-Flash模型
2026-01-20 16:17:32
大厂AI各走「开源」路
2025-10-17 09:09:57
AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍
2025-11-05 18:16:46
蚂蚁发布并开源万亿参数思考模型Ring-1T
2025-10-14 17:25:02
阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini
2025-10-04 14:01:20
刚刚,Fable-5之下,智谱开源的GLM-5.2拿下AI编程第一!
2026-06-17 11:30:37
腾讯智能体开源大动作!关键技术都拿出来了,开发平台还全面升级
2025-09-22 12:58:11
855 文章
844356 浏览
24小时热文
更多
-
2026-06-27 21:13:09 -
2026-06-27 21:11:26 -
2026-06-27 21:09:48