
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2月18日,阶跃星辰与吉利汽车集团联合宣布,将合作研发的两款多模态大模型开源。其中包括全球参数量最大、性能最优的开源视频生成模型Step-Video-T2V,及首款产品级开源语音交互大模型Step-Audio。双方自2023年起在多个领域展开深度合作,显著提升了模型性能。3月初,吉利还将发布AI智能化战略,推动AI科技在智能座舱、高阶智驾等领域的应用。
原文链接
阿里通义千问近期宣布开源了两款大型语音交互模型——Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。这一创新突破了传统的文本输入限制,允许用户通过语音与模型进行自由互动。模型具备两种交互模式:一种是语音聊天,无需用户输入文本即可与之交流;另一种则是音频分析模式,在对话过程中用户可以提供音频和文本指令以进行深度音频分析。
Qwen2-Audio 在多项基准数据集上的测试结果显著优于前代模型,展现出卓越的性能。这一开源项目不仅提供了试用链接,还公开了详细的论文、评估标准和代码库,鼓励开发者和研究者进一步探索和应用这一技术。随着人工智能领域的快速发展,阿里此举不仅推动了语音交互技术的进步,也为行业带来了新的创新机遇。
原文链接
加载更多

暂无内容