阿里通义千问于1月28日宣布开源全新视觉理解模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。该模型能识别物体、分析图像文本、理解长视频及捕捉事件。Qwen2.5-VL具备代理能力,可推理并使用工具,无需特定任务微调。在测试中,旗舰模型Qwen2.5-VL-72B-Instruct表现优异,涵盖多领域任务。较小模型Qwen2.5-VL-7B-Instruct在多项任务中超越GPT-4o-mini,Qwen2.5-VL-3B亦有出色表现。新模型增强对时空尺度感知,简化网络结构,提升效率。
原文链接
本文链接:https://kx.umi6.com/article/12284.html
转载请注明文章出处
相关推荐
换一换
单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2
2025-06-04 14:20:36
视觉理解模型定价低于同行85% 火山引擎谭待回应:仍然能有合理的毛利
2024-12-20 11:28:56
阿里通义千问全新视觉理解模型 Qwen2.5-VL 开源:三尺寸版本、支持理解长视频和捕捉事件等能力
2025-01-28 08:41:31
阿里开源视觉理解模型Qwen3-VL
2025-09-24 14:43:41
继续狂飙!豆包“全家桶”迎来重磅更新 视觉理解、视频生成功能都来了
2024-12-18 13:31:32
百度智能云开源视觉理解模型 Qianfan-VL,基于自研昆仑芯 P800 芯片计算
2025-09-22 22:02:49
大模型降价潮再起
2025-01-02 09:10:25
百度开源视觉理解模型Qianfan-VL!全尺寸领域增强+全自研芯片计算
2025-09-23 02:05:39
杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini
2025-01-28 10:42:11
杀疯了!字节豆包视觉理解模型价格下降85%,火山引擎谭待:现在不太关注市场竞争
2024-12-18 17:35:19
豆包视觉理解模型发布
2024-12-18 10:30:52
超越Gemini3、GPT5.1,阿里千问登顶空间推理全球冠军
2025-11-26 15:49:46
黄仁勋:AI时代蓝领更吃香 水管工、电工能拿六位数薪水
2026-01-22 07:42:15
653 文章
423941 浏览
24小时热文
更多
-
2026-01-22 22:15:16 -
2026-01-22 22:14:12 -
2026-01-22 21:11:56