阿里通义千问近期宣布开源了两款大型语音交互模型——Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。这一创新突破了传统的文本输入限制,允许用户通过语音与模型进行自由互动。模型具备两种交互模式:一种是语音聊天,无需用户输入文本即可与之交流;另一种则是音频分析模式,在对话过程中用户可以提供音频和文本指令以进行深度音频分析。 Qwen2-Audio 在多项基准数据集上的测试结果显著优于前代模型,展现出卓越的性能。这一开源项目不仅提供了试用链接,还公开了详细的论文、评估标准和代码库,鼓励开发者和研究者进一步探索和应用这一技术。随着人工智能领域的快速发展,阿里此举不仅推动了语音交互技术的进步,也为行业带来了新的创新机遇。
原文链接
本文链接:https://kx.umi6.com/article/4925.html
转载请注明文章出处
相关推荐
换一换
阿里通义千问推出编程模型Qwen3-Coder-Flash
2025-08-01 09:24:35
权威榜单发布,全球开源大模型前十均为阿里通义千问衍生模型
2025-02-10 16:10:32
阿里通义千问Qwen2大模型发布并同步开源
2024-06-07 09:35:19
阿里通义千问正式推出QVQ-Max视觉推理模型第一版
2025-03-28 13:48:04
阿里通义千问推出Qwen Chat桌面端
2025-07-12 08:49:02
英伟达开源多个代码大模型 以阿里通义千问为底座
2025-05-09 15:51:07
阿里通义千问推出视觉推理模型 QVQ-Max:可分析、推理图片和视频内容
2025-03-28 11:43:06
阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型:自由互动,无需输入文本
2024-08-13 13:12:06
消息称阿里通义千问大模型技术负责人周畅将离职创业
2024-07-18 09:31:35
阿里通义千问开源视觉推理模型 QVQ-72B-Preview:像物理学家一样思考
2024-12-25 12:02:19
阿里深夜炸场!通义千问发布新一代端到端旗舰模型Qwen2.5-Omni
2025-03-27 04:26:09
阿里千问API调用量跃居全球第四
2025-07-28 18:17:34
阿里通义千问推出Qwen3-Max-Thinking尝鲜版
2025-11-04 17:23:23
627 文章
371285 浏览
24小时热文
更多
-
2025-12-11 00:19:01 -
2025-12-11 00:15:55 -
2025-12-10 23:15:05