标题:MetaSpatial:用50条数据提升三维空间推理能力
在三维空间理解任务中,让视觉语言模型生成合理布局面临挑战,现有模型虽能识别物体,但缺乏真实空间建模。为解决此问题,西北大学研究人员提出MetaSpatial框架,通过强化学习策略显著提升模型的空间推理能力。
MetaSpatial首次将基于规则奖励的强化微调策略应用到三维空间布局任务中。它仅需约50条无标注数据,通过构建奖励函数衡量布局合理性,包括物理约束、格式规范及用户偏好。模型通过多轮优化逐步改进布局决策,无需依赖大规模标注数据即可掌握多样化空间推理策略。
实验显示,MetaSpatial在多个指标上优于传统方法。它不仅提升布局连贯性和物理一致性,还增强模型的泛化能力。框架支持多轮布局优化与Group Relative Policy Optimization策略,确保模型稳定高效学习。
MetaSpatial开源发布,包含代码、数据集生成工具及完整数据集,为三维场景生成提供更多可能性。
原文链接
本文链接:https://kx.umi6.com/article/15952.html
转载请注明文章出处
相关推荐
换一换
2025上半年,AI Agent领域有什么变化和机会?
2025-07-11 08:33:06
万字梳理:揭秘 DeepSeek 中的 RL 与 AGI 下一步丨AIR 2025
2025-03-08 11:48:22
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
2025-07-11 11:34:40
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
全新合成框架SOTA:强化学习当引擎,任务合成当燃料,蚂蚁港大联合出品
2025-10-01 18:47:16
UCL强化学习派:汪军与他的学生们
2025-02-27 19:41:38
Meta万引强化学习大佬跑路!用小扎原话作为离别寄语,扎心了
2025-08-26 13:43:07
亚马逊开建AGI实验室,一号位也是华人
2025-09-22 09:54:37
发自 凹非寺量子位 | 公众号 QbitAI 奥特曼点名表扬了两个波兰人。 没有他们,OpenAI就不是今天的样子。 他们是OpenAI首席科学家Jakub Pachocki以及头衔为“Technical Fellow”的Szymon Sidor。 △左:Jakub Pachocki,右:Szymon Sidor 两人不仅是波兰老乡,而且是高中同学,读博时分别选择了计算机科学和机器人,后来又在OpenAI重聚。 在ChatGPT风靡全球、每天服务数亿用户的今天,奥特曼感慨大多数人永远不会想到背
2025-09-09 18:18:27
稚晖君机器人“葡萄缝针”神技再现江湖 这次是人形的
2025-03-11 23:55:21
50条数据解锁空间智能,RL视觉语言模型3D空间推理框架MetaSpatial |西北大学
2025-03-22 17:26:13
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
2025-03-20 19:41:21
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
2025-05-23 13:51:09
521 文章
260423 浏览
24小时热文
更多
-
2025-10-25 18:38:20 -
2025-10-25 18:37:15 -
2025-10-25 16:32:54