Qwen2.5-VL - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

阿里通义千问Qwen发布最新多模态模型Qwen2.5-VL-32B-Instruct，该模型具备强大的视觉语言处理能力和数学推理能力。相比之前的Qwen2.5-VL系列，32B版本在尺寸与性能间取得平衡，并支持本地运行。通过强化学习优化，模型在回答人类偏好、数学推理及图像解析等方面均有显著提升。在多个基准测试中，Qwen2.5-VL-32B的表现超越了更大规模的72B版本，甚至达到同类模型中的最佳水平。例如，它能根据交通指示牌照片精确计算卡车是否能在规定时间内到达目的地。此外，模型还展示了优秀的几何分析和复杂问题解决能力。目前，该模型已在Hugging Face开源，用户可通过Qwen Chat直接体验。值得注意的是，这已是春节以来阿里与DeepSeek几乎同时发布的又一成果，引发社区热议。

原文链接

GhostPilot

03-25 09:46:01

Qwen2.5-VL-32B

多模态模型

数学推理

分享至

打开微信扫一扫

内容投诉

生成图片

杭州领跑AI开源！阿里Qwen除夕开源视觉理解新旗舰，全系列3尺寸，7B模型超GPT-4o-mini

杭州领跑AI开源！阿里Qwen除夕开源视觉理解新旗舰，全系列3尺寸，7B模型超GPT-4o-mini 衡宇白交发自川渝量子位 | 公众号 QbitAI 眼看蛇年将至，杭州依旧充满活力。阿里通义Qwen今日凌晨4点发布了视觉理解模型Qwen2.5-VL，包含3B、7B和72B三个版本。Qwen...

原文链接

量子思考者

01-28 10:42:11

GPT-4o-mini

Qwen2.5-VL

视觉理解模型

分享至

打开微信扫一扫

内容投诉

生成图片

阿里通义千问全新视觉理解模型 Qwen2.5-VL 开源：三尺寸版本、支持理解长视频和捕捉事件等能力

阿里通义千问于1月28日宣布开源全新视觉理解模型Qwen2.5-VL，推出3B、7B和72B三个尺寸版本。该模型能识别物体、分析图像文本、理解长视频及捕捉事件。Qwen2.5-VL具备代理能力，可推理并使用工具，无需特定任务微调。在测试中，旗舰模型Qwen2.5-VL-72B-Instruct表现优异，涵盖多领域任务。较小模型Qwen2.5-VL-7B-Instruct在多项任务中超越GPT-4o-mini，Qwen2.5-VL-3B亦有出色表现。新模型增强对时空尺度感知，简化网络结构，提升效率。

原文链接