机器人迈向复杂真实环境时,现有的视觉-语言-动作模型(VLA)面临动作生成“黑盒化”的痛点,难以应对环境杂乱、步骤繁琐和空间定位不准等挑战。为此,复旦大学联合上海交大、港大等机构提出GuidedVLA(已被RSS 2026接收),让机器人的行动更有依据。
GuidedVLA的核心是在动作生成中引入显式引导,将其拆分为三个专属“注意力头”: 1. 目标头(Object Head):精准锁定目标物体,抵抗背景干扰; 2. 技能头(Skill Head):识别任务当前阶段,防止步骤错乱或跳步; 3. 深度头(Depth Head):引入3D深度特征,提升距离、角度等空间几何准确度。
技术上,它采用残差适配设计,可“即插即用”于现有VLA而不破坏原模型能力,并配备自动标注流水线以大幅降低人工成本。
实验显示,GuidedVLA在仿真基准及真实双臂机器人(如家庭分拣、实验室操作)任务中,成功率均获显著提升。其最大价值在于实现了“可解释性落地”:模型是否看准目标、认清阶段、估对空间均可被量化观察,且与成功率直接挂钩。这不仅提升了机器人性能,更为排查故障和模型迭代提供了清晰抓手,推动具身智能真正走向复杂现实场景。
原文链接
本文链接:https://kx.umi6.com/article/36441.html
转载请注明文章出处
相关推荐
换一换
它石智航用“吉尼斯纪录”交卷真干活的具身大脑,丁文超:从来没有Plan B
2026-03-26 11:52:35
它石智航Pre-A轮融资4.55亿美元 破中国具身智能领域单轮融资纪录
2026-04-16 11:59:56
刚刚,机器人练成了宁次的「白眼」:∞帧画面边看边3D重建我们的世界!
2026-04-16 22:21:46
20亿美金苏度科技具身首秀即大招!0真机数据,zero-shot,跑出98%首次抓取成功率
2026-04-20 14:05:46
有余凯不投的地平线离职创业员工吗?
2026-06-07 21:50:41
深圳:支持建设具身智能技术试验场
2026-02-12 19:43:39
智元机器人联合隆鑫通用、卧龙电驱 新设两家具身智能公司
2026-03-10 15:27:19
西湖大学王东林团队论文:机器人需要“通古今,知未来”丨CVPR 2026
2026-03-24 11:47:03
原华为云AI算法创新Lab主任朱森华创业 押注类脑智能与具身模型
2026-05-25 17:43:40
机器人线下真机对线打PK!这届黑客松可太会玩了
2026-03-31 14:52:20
智象未来携手诺亦腾机器人,共创具身智能数据新范式
2026-03-30 15:57:10
无垠拓界 基筑未来|无问智科重磅发布业界首个物理AI数据基座平台
2026-03-06 15:07:52
独家 | 华为19级天才少年赵立晨离职创业,瞄准具身 Agentic OS
2026-04-22 13:09:33
786 文章
657657 浏览
24小时热文
更多
-
2026-06-08 12:28:00 -
2026-06-08 12:26:28 -
2026-06-08 12:24:46