阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型：自由互动，无需输入文本

2024-08-13 13:12:06

E-Poet

发布在

快讯

阅读：316

阿里通义千问近期宣布开源了两款大型语音交互模型——Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。这一创新突破了传统的文本输入限制，允许用户通过语音与模型进行自由互动。模型具备两种交互模式：一种是语音聊天，无需用户输入文本即可与之交流；另一种则是音频分析模式，在对话过程中用户可以提供音频和文本指令以进行深度音频分析。 Qwen2-Audio 在多项基准数据集上的测试结果显著优于前代模型，展现出卓越的性能。这一开源项目不仅提供了试用链接，还公开了详细的论文、评估标准和代码库，鼓励开发者和研究者进一步探索和应用这一技术。随着人工智能领域的快速发展，阿里此举不仅推动了语音交互技术的进步，也为行业带来了新的创新机遇。

原文链接

本文链接：https://kx.umi6.com/article/4925.html

转载请注明文章出处

Qwen2-Audio