Drawing to Reason in Space

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

太可怕了！AI大模型已学会人类空间思考能力

近日，蚂蚁技术研究院联合中科院自动化所和香港中文大学开源ViLaSR-7B大模型，实现了AI的空间思考能力，在多个空间推理任务中达到新SOTA。该模型通过‘Drawing to Reason in Space’范式，让AI像人类一样‘边画边想’，在迷宫导航、视频空间推理等5个基准测试中平均提升18.4%，尤其在VSI-Bench上达45.4%，超Gemini-1.5-Pro。研究采用三阶段训练框架：冷启动训练建立基础能力，反思拒绝采样增强自我修正，强化学习优化绘图操作效率。ViLaSR-7B展现出类人的空间推理策略，如参考物度量推理和跨帧对象追踪，提升推理可解释性和可控性。此成果为机器人导航等领域奠定基础，预示AI向通用空间智能迈进的重要一步。

原文链接