阿里开源全模态大模型Qwen3-Omni 可像人类一样听说写

2025-09-24 16:50:21

AI创想团

发布在

快讯

阅读：1231

9月24日，阿里巴巴发布全模态预训练大模型Qwen3-Omni系列。该模型在36个音视频基准测试中，22项达SOTA水平，32项取得开源模型最佳效果，语音识别、音频理解与对话能力媲美Gemini2.5-Pro。Qwen3-Omni支持全模态输入输出，通过多模态混合训练实现“听”“说”“写”能力，预训练采用单模态与跨模态数据结合。其在音频、音视频能力突出的同时，文本与图像性能保持稳定，首次实现业内这一综合训练效果。

原文链接

本文链接：https://kx.umi6.com/article/25792.html

转载请注明文章出处

Qwen3-Omni