北京时间3月27日凌晨,阿里巴巴推出通义千问系列新旗舰模型Qwen2.5-Omni。该端到端多模态模型可处理文本、图像、音频及视频等多种输入,具备实时流式响应能力。Qwen2.5-Omni采用全新Thinker-Talker架构,引入TMRoPE技术,提升多模态输入同步精度。其语音生成自然流畅,端到端语音指令跟随能力出色,在MMLU、GSM8K等基准测试中表现优异。模型在OmniBench多模态任务中达到SOTA表现,单模态任务中亦表现突出。目前,Qwen2.5-Omni已在Hugging Face、ModelScope、DashScope及GitHub开源。
原文链接
本文链接:https://kx.umi6.com/article/16214.html
转载请注明文章出处
相关推荐
换一换
阿里通义千问推出编程模型Qwen3-Coder-Flash
2025-08-01 09:24:35
AI科学家能不能理解普通人对AI的需求,怎么理解?
2024-10-09 10:59:30
阿里通义千问开源视觉推理模型 QVQ-72B-Preview:像物理学家一样思考
2024-12-25 12:02:19
全新创作平台SkyReels来了!一张画布+对话框包办AI视频创作流程
2025-11-04 13:13:09
阿里 AI 实力获斯坦福权威报告盖章!通义千问贡献排名全球第三、中国第一
2025-04-11 16:57:29
Ilya观点得证!仅靠预测下一个token统一图像文本视频,智源发布原生多模态世界模型Emu3
2024-10-21 13:24:07
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
华为开源7B多模态模型,视觉定位和OCR能力出色,你的昇腾端侧“新甜点”来了
2026-01-05 14:06:30
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
2024-11-11 16:11:01
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
2025-07-09 14:06:26
独家|华为昇腾适配阶跃星辰多模态开源模型
2025-03-10 14:41:01
Kimi最新多模态模型K2-VL提前现身
2026-01-05 15:13:56
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
2025-03-25 09:39:46
659 文章
430586 浏览
24小时热文
更多
-
2026-01-23 21:15:09 -
2026-01-23 21:14:01 -
2026-01-23 20:15:45