1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
字节Seed发布GR-RL 首次实现真机强化学习穿鞋带
12月2日,字节跳动Seed团队发布最新研究成果GR-RL,首次实现机器人真机强化学习完成整只鞋连续穿鞋带的任务。GR-RL通过从离线数据筛选到在线真机微调的强化学习框架,显著提升了操作成功率。相比前作监督学习模型GR-3,GR-RL将穿鞋带任务的成功率从45.7%提升至83.3%,同时减少了近70%的失败情况。这一成果拓展了VLA模型在长时程精细灵巧操作方面的能力边界,为机器人技术的发展提供了重要参考。
QuantumHacker
12-02 14:21:13
字节跳动
强化学习
穿鞋带
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序