机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025
如何让AI像人一样,仅凭少量演示就能适应复杂多变的真实场景?美国东北大学和波士顿动力RAI提出了一种名为HEP(Hierarchical Equivariant Policy via Frame Transfer)的框架,通过“坐标系转移接口”显著提升机器人学习效率与泛化能力。
HEP框架的核心亮点包括:
1. 分层策略结构:高层负责全局目标设定,低层在局部坐标系中优化动作,提升灵活性与效率。
2. 空间对称性泛化:模型自动适应目标平移、旋转等变化,降低对数据量的依赖。
3. 创新型体素编码器:高效表达三维视觉信息,兼顾细节还原与计算速度。
HEP基于两个核心思想:分层策略与“坐标系转移接口”。高层策略通过预测关键姿态(目标3D平移)进行长时程规划,低层策略在此基础上生成细粒度运动轨迹。“坐标系转移接口”具有三大特点:传递高层泛化能力、提供软约束以优化局部轨迹、赋予自然泛化到新姿态的能力。这种设计不仅增强了低层灵活性,还将高层的抗干扰性与泛化能力传递到底层,实现了鲁棒性与泛化性的统一。
为验证效果,研究团队在RLBench模拟平台的30个任务及真实机器人上的3个操作任务中测试了HEP框架。结果显示:
- 在复杂长程任务中,HEP仅用30条演示数据即可完成多步协作任务,如“洗锅”,表现优于非分层方法。
- 在Pick&Place任务中,HEP通过一次演示即可实现1-shot泛化学习,显著提升数据效率。
- 在环境变化和扰动测试中,HEP的成功率较传统方法提升高达60%。
此外,坐标系转移接口对低层策略施加软约束,既保证灵活性,也为未来引入多模态或跨平台高层策略提供了扩展可能。
一句话结论:HEP框架通过“坐标系转移接口”实现了高层泛化性与鲁棒性的无损传递,为智能体的开放性集成与泛化部署开辟了新路径。
论文地址:https://openreview.net/pdf?id=nAv5ketrHq
项目代码:https://codemasterzhao.github.io/HierEquiPo.github.io/
.png)

-
2025-07-22 21:40:00
-
2025-07-22 21:39:04
-
2025-07-22 19:38:40