
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
阿里通义千问Qwen发布最新多模态模型Qwen2.5-VL-32B-Instruct,该模型具备强大的视觉语言处理能力和数学推理能力。相比之前的Qwen2.5-VL系列,32B版本在尺寸与性能间取得平衡,并支持本地运行。通过强化学习优化,模型在回答人类偏好、数学推理及图像解析等方面均有显著提升。在多个基准测试中,Qwen2.5-VL-32B的表现超越了更大规模的72B版本,甚至达到同类模型中的最佳水平。例如,它能根据交通指示牌照片精确计算卡车是否能在规定时间内到达目的地。此外,模型还展示了优秀的几何分析和复杂问题解决能力。目前,该模型已在Hugging Face开源,用户可通过Qwen Chat直接体验。值得注意的是,这已是春节以来阿里与DeepSeek几乎同时发布的又一成果,引发社区热议。
原文链接
杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini
衡宇 白交 发自 川渝
量子位 | 公众号 QbitAI
眼看蛇年将至,杭州依旧充满活力。阿里通义Qwen今日凌晨4点发布了视觉理解模型Qwen2.5-VL,包含3B、7B和72B三个版本。Qwen...
原文链接
阿里通义千问于1月28日宣布开源全新视觉理解模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。该模型能识别物体、分析图像文本、理解长视频及捕捉事件。Qwen2.5-VL具备代理能力,可推理并使用工具,无需特定任务微调。在测试中,旗舰模型Qwen2.5-VL-72B-Instruct表现优异,涵盖多领域任务。较小模型Qwen2.5-VL-7B-Instruct在多项任务中超越GPT-4o-mini,Qwen2.5-VL-3B亦有出色表现。新模型增强对时空尺度感知,简化网络结构,提升效率。
原文链接
加载更多

暂无内容