阿里通义千问近期宣布开源了两款大型语音交互模型——Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。这一创新突破了传统的文本输入限制,允许用户通过语音与模型进行自由互动。模型具备两种交互模式:一种是语音聊天,无需用户输入文本即可与之交流;另一种则是音频分析模式,在对话过程中用户可以提供音频和文本指令以进行深度音频分析。 Qwen2-Audio 在多项基准数据集上的测试结果显著优于前代模型,展现出卓越的性能。这一开源项目不仅提供了试用链接,还公开了详细的论文、评估标准和代码库,鼓励开发者和研究者进一步探索和应用这一技术。随着人工智能领域的快速发展,阿里此举不仅推动了语音交互技术的进步,也为行业带来了新的创新机遇。
原文链接
本文链接:https://kx.umi6.com/article/4925.html
转载请注明文章出处
相关推荐
.png)
换一换
阿里通义千问宣布启用新域名“tongyi.ai”,网页版聊天新增深度搜索功能
2024-08-19 21:26:30
阿里通义千问推出 Qwen2-VL:开源 2B / 7B 模型,处理任意分辨率图像无需分割成块
2024-08-30 10:12:38
阿里通义千问:Qwen Code每天可享2000次免费调用
2025-08-12 18:24:15
阿里通义千问开源视觉推理模型 QVQ-72B-Preview:像物理学家一样思考
2024-12-25 12:02:19
消息称阿里通义千问大模型技术负责人周畅将离职创业
2024-07-18 09:31:35
Manus 与阿里通义千问团队达成战略合作,在国产模型和算力平台上实现 Manus 全部功能
2025-03-11 19:47:06
阿里通义千问宣布推出多模态模型 Qwen VLo,实现从感知到生成的跨越
2025-06-28 00:15:30
阿里通义千问正式推出QVQ-Max视觉推理模型第一版
2025-03-28 13:48:04
爆火出圈后 Manus与阿里通义千问达成合作
2025-03-11 20:49:32
阿里通义千问:确实在与 Manus 进行开源模型方面的合作
2025-03-11 20:47:27
阿里千问QwQ-32B获海外青睐:多家海外AI平台已接入
2025-03-13 12:19:26
多模态实力领跑开源大模型!阶跃星辰与吉利宣布联合开源两款多模态大模型
2025-02-18 10:16:14
阿里 AI 实力获斯坦福权威报告盖章!通义千问贡献排名全球第三、中国第一
2025-04-11 16:57:29
508 文章
174750 浏览
24小时热文
更多

-
2025-09-06 20:38:03
-
2025-09-06 19:37:51
-
2025-09-06 16:37:17