1小时真机RL微调成功率破95%！HIL-ResRL：即插即用的VLA“外挂”神器

2026-06-24 18:44:53

阿达旻

发布在

快讯

阅读：118

近日，华为云CloudRobo团队提出一种即插即用的视觉-语言-动作（VLA）模型“外挂”神器——HIL-ResRL（基于人机协同残差强化学习的微调适配器）。针对现有VLA模型在真实物理世界中易受误差累积影响、真机强化学习成本高昂等痛点，该方案将基础模型视为黑盒，通过轻量级残差策略结合“人类在环”护航进行纠偏。真机实验表明，在抓取、高精度插拔等工业任务中，仅需1小时在线训练，任务成功率即可飙升至95%以上，并大幅降低安全风险。此外，该技术还能无缝接入多模态触觉反馈。HIL-ResRL以轻量、高效的优势，为具身智能在柔性制造中的快速落地提供了全新破局思路。

原文链接

本文链接：https://kx.umi6.com/article/36679.html

转载请注明文章出处

HIL-ResRL