1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:北大卢宗青团队新作:超 70% 实机成功率,支持语言指令的功能性抓取系统

在机器人研究中,抓取问题正成为智能发展的关键。尽管大模型已能理解语言和规划任务,但在物理接触中仍显笨拙。现有研究多关注稳定性,但功能性抓取更接近真实智能,例如端杯倒水、握锤敲击等。难点在于,功能性抓取涉及物体结构、用途及操控部位的综合理解,传统方法难以应对灵巧手的高维控制空间。

北京大学卢宗青团队提出了一种名为 DemoFunGrasp 的方法,通过演示编辑强化学习重新建模功能性抓取。该方法不仅关注是否抓住物体,还聚焦于如何围绕功能需求进行抓取,将功能位置与抓取姿态纳入统一框架,并在仿真与真实环境中验证,成功率达 70% 以上。

实验表明,DemoFunGrasp 在大规模仿真环境中表现优异,涵盖 3000 多种不同形状和功能的物体。机器人能在功能约束下完成抓取,如抓住杯子把手或喷壶扳机。此外,功能区域对准精度显著提高,偏差降至约 3 厘米,而传统方法常偏离功能点。抓取风格也表现出多样性和可控性,策略能根据输入生成不同抓取姿态,如捏持、侧持等。

在真实机器人平台上,研究使用 7 自由度机械臂加灵巧手系统测试日常物体,仅依赖摄像头图像即取得超过 70% 的成功率。机器人不仅能完成抓取,还能执行后续功能动作,如倒水或喷洒。消融实验证明,设计中的关键模块不可或缺,例如风格扰动机制和尺寸归一化。

研究的核心思想是将“功能抓取”从直觉概念转化为建模问题,结合强化学习与模仿学习求解。团队引入演示编辑强化学习,通过基础示范轨迹降低学习难度,并设计奖励函数确保功能与风格约束。此外,视觉语言模型被用于理解语言指令,定位功能区域并指导抓取。

这项研究的意义在于:1)将抓取目标从“几何稳定性”转向“语义功能性”,迈向智能操作;2)为灵巧手强化学习提供新路径,适用于多种复杂任务;3)构建完整闭环,实现从语言到低层控制的自主决策。

通讯作者卢宗青为北京大学副教授,长期致力于多模态模型与强化学习结合,其成果已在多家企业应用。2025 年,他创立北京智在无界科技有限公司,推动多模态姿态模型研发与产业化。

论文地址:https://arxiv.org/pdf/2512.13380v1
参考链接:https://z0ngqing.github.io/

原文链接
本文链接:https://kx.umi6.com/article/31601.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
北大卢宗青团队新作:超 70% 实机成功率,支持语言指令的功能性抓取系统
2026-01-14 11:42:15
AI太记仇!做完心理治疗后仍记得「被工程师虐待」
2026-01-13 16:43:13
Nano Banana Pro 新对手,智谱联合华为开源首个国产芯片训练的多模态 SOTA 模型 GLM-Image
2026-01-14 10:24:53
Anthropic CEO 自曝:Claude 本可抢跑 ChatGPT,我们按下了暂停键
2026-01-12 18:47:18
国内首个农业开源大语言模型“司农”发布
2026-01-13 14:39:49
穆迪:预计数据中心未来五年投资或达3万亿美元
2026-01-12 21:59:21
摩尔线程联合智源完成RoboBrain 2.5的全流程训练
2026-01-13 19:52:12
AI智能硬件大爆发,你会为哪一款买单?
2026-01-14 11:39:39
消息称阿里千问明天将有“重磅产品迭代”,C 端月活用户已破亿
2026-01-14 12:31:30
视觉中国与PureblueAI清蓝达成战略合作 将围绕“数据供给+GEO营销的全链路服务”展开深度协同
2026-01-14 12:34:18
扎克伯格启动Meta Compute项目 2030年前狂建数十吉瓦AI基建
2026-01-13 04:12:06
消息称韩国 AI 芯片企业 Rebellions 向马斯克 xAI 交付样品
2026-01-13 12:33:38
郭明錤:苹果AI硬件需求在2027年开始会有较显著增长
2026-01-14 08:21:08
24小时热文
更多
扫一扫体验小程序