正文:11月26日,阿里千问的视觉理解模型Qwen3-VL和Qwen2.5-VL在空间推理基准测试SpatialBench榜单中位列前两名,超越Gemini 3、GPT-5.1等国际顶尖模型。SpatialBench是一项衡量多模态模型在空间、结构、路径等方面综合推理能力的新兴标准,对具身智能落地至关重要。Qwen3-VL和Qwen2.5-VL分别获得13.5分和12.9分,远超Gemini 3.0 Pro Preview(9.6分)和GPT-5.1(7.5分)。尽管AI整体表现仍不及人类基准线(约80分),但Qwen3-VL在视觉感知和多模态推理方面取得突破,可实现‘带图推理’和‘视觉编程’,并增强3D检测能力,助力机器人精准抓取物体。Qwen3-VL已开源多个版本,并上线千问APP供用户免费体验。
原文链接
本文链接:https://kx.umi6.com/article/29185.html
转载请注明文章出处
相关推荐
换一换
密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板丨清华ICCV25
2025-07-14 14:19:19
百度智能云开源视觉理解模型 Qianfan-VL,基于自研昆仑芯 P800 芯片计算
2025-09-22 22:02:49
李飞飞谢赛宁新作「空间推理」:多模态大模型性能突破关键所在
2024-12-23 12:52:12
阿里千问大模型技术负责人自宣卸任
2026-03-04 09:27:14
Meta使用阿里千问优化其最新AI模型
2025-12-11 00:19:01
独家 | 阿里千问月活突破1亿
2026-01-14 11:47:21
阿里千问启用全新域名,提供更多 Qwen3 系列模型
2025-11-24 20:13:26
阿里千问(Qwen)衍生模型数量破 10 万,位居全球开源模型榜首
2025-02-25 17:02:40
视觉理解模型定价低于同行85% 火山引擎谭待回应:仍然能有合理的毛利
2024-12-20 11:28:56
夸克发布AI浏览器 融合阿里千问
2025-11-26 14:49:57
大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”,5个基准平均提升18.4%
2025-06-21 15:10:12
夸克AI眼镜发布 搭载阿里千问
2025-11-27 15:48:57
阿里千问完成超100万单奶茶 参与页面一度出现卡顿
2026-02-06 10:46:15
702 文章
497407 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18