3月27日凌晨,阿里云发布通义千问Qwen模型家族新成员——Qwen2.5-Omni,这是一款端到端多模态旗舰模型,并已在Hugging Face、ModelScope、DashScope和GitHub上开源。Qwen2.5-Omni支持文本、图像、音频和视频等多种输入形式,具备实时流式响应能力,能同时生成文本与自然语音合成输出。该模型采用了Thinker-Talker双核架构,Thinker模块处理多模态输入生成语义表征,Talker模块则负责流畅生成语音。相比同类单模态模型,Qwen2.5-Omni在多模态任务OmniBench上达到SOTA表现,并在语音识别、翻译、音频理解等多个单模态任务中表现出色。用户可通过提供的链接访问相关资源和Demo体验。
原文链接
本文链接:https://kx.umi6.com/article/16217.html
转载请注明文章出处
相关推荐
换一换
阿里云百炼官宣通义千问3-Max模型降价
2025-11-13 23:26:41
GPT-5信息大量泄露,四个版本全曝光,免费用户也能用,还有一个神秘功能
2025-08-07 18:55:45
硅基流动新获阿里领投数亿元融资
2025-06-09 19:35:13
大模型呼唤开源多模态 AI加速冲刺物理世界
2025-06-07 14:50:49
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
2025-07-28 10:09:36
阿里最新AI编程大模型上线 百万Tokens价格为Claude 4的1/3
2025-07-23 21:59:15
阿里云宣布通义完成安全升级
2025-09-25 18:09:38
参数超万亿:阿里发布通义千问最强 AI 大模型 Qwen3-Max 正式版,性能全面领先
2025-09-24 11:36:59
阿里云发布多模态交互开发套件 可应用于AI眼镜、机器人等
2026-01-08 12:17:50
o3出圈玩法“看图猜位置”,豆包也安排上了!还是人人免费用那种
2025-07-30 15:46:31
阿里中标工商银行AI编程项目
2025-08-05 15:20:45
百度:推出首个多模态高度融合数字人
2025-06-17 16:25:35
商汤「日日新6.5」全新升级,让AI完成从“工具”到“人”的跃迁
2025-07-29 20:35:07
628 文章
463397 浏览
24小时热文
更多
-
2026-01-23 21:15:09 -
2026-01-23 21:14:01 -
2026-01-23 20:15:45