标题:银河通用✖清华 | 为机器人赋予“避障直觉”,轻松穿梭复杂环境
清华大学与北京银河通用机器人股份有限公司合作开发了一种名为HumanoidPF(人形势能场)的创新方法,为机器人赋予了类似人类的“避障直觉”。该研究由薛晗、梁斯凯和张智楷等人共同完成,指导老师为清华大学助理教授弋力。
传统避障方法依赖强化学习,通过碰撞惩罚让机器人试错,效率低下且难以处理复杂场景。而HumanoidPF通过构建连续梯度场,将机器人与障碍物的空间关系编码为“吸引力”和“排斥力”,引导机器人自主选择安全路径,无需复杂计算即可完成弯腰、抬腿、侧身等动作。这种方法显著提升了机器人在真实家居场景中的实用性。
核心机制:势能场导航
HumanoidPF借鉴了经典人工势能场(APF)的思想,但针对人形机器人多关节结构进行了优化:
1. 吸引力场:引导机器人朝目标点移动,同时避开障碍物;
2. 排斥力场:基于障碍物距离生成排斥力,越接近障碍物排斥力越强;
3. 优先级加权:核心部位(如骨盆)权重更高,确保整体运动稳定,四肢灵活适配;危险部位动态提升权重,优先规避高风险区域。
此外,HumanoidPF通过感知输入和奖励引导双重方式融入强化学习,大幅提升了训练效率。机器人无需等到碰撞发生即可获得实时反馈,学习速度显著加快。
混合场景训练:见多识广
为了增强泛化能力,研究团队提出混合场景生成策略:从真实数据集中裁剪场景块,结合程序化生成的复杂障碍物(如地面凸起、高空悬挂物),并通过课程学习逐步增加难度。这种训练方式让机器人能够应对复合场景,例如“弯腰躲吊灯+抬腿跨杂物+侧身挤窄缝”。
实测表现:高效且稳定
在仿真测试中,HumanoidPF在8类复杂场景中的成功率超过90%,远超现有方法。在真实世界中,机器人通过“点击导航”系统,可自主规划路径并完成任务,例如弯腰避开茶几、抬腿跨过书本、侧身穿过窄缝等,全程无碰撞。此外,机器人还能应对未知场景和动态干扰,展现出强大的鲁棒性。
关键优势
1. 前瞻性引导:通过梯度场提供实时指引,避免低效试错;
2. 低迁移gap:势能场平滑传感器噪声,从仿真到现实几乎无需额外微调;
3. 通用适配:不依赖特定障碍物类型,适应规则家具和不规则杂物。
总结
HumanoidPF为机器人构建了一套“机器人-障碍物关系”的通用语言,将复杂空间感知转化为直观运动指引,使避障从“试错”变为“本能”。这项技术为人形机器人在日常生活中的应用奠定了基础,未来有望实现更智能的家务助手和自主导航设备。
• 论文链接:https://arxiv.org/abs/2601.16035
• 项目主页:https://axian12138.github.io/CAT/
• GitHub:https://github.com/GalaxyGeneralRobotics/Click-and-Traverse
-
2026-01-31 17:49:48 -
2026-01-31 16:46:37 -
2026-01-31 15:44:24