现在的机器人(具身智能)正面临早期自动驾驶同样的难题:数据太多却“各自为政”。不同机器人、不同相机采集的数据格式各异,缺乏统一标准。盲目堆砌数据只会导致混乱,无法实现规模化训练。
当年,自动驾驶靠BEV(鸟瞰图)技术破局,将多视角数据统一到一个三维物理坐标系中。如今,跨维智能推出Dexterity-BEV,把这套方法用在机器人身上,为具身智能修筑了数据高速公路。
它的核心绝招有三点: 1. 空间对齐:给2D视觉模型装上“3D骨架”,把不同相机的画面统一转换到俯视三维空间,让机器人真正理解物理世界,而非死记画面。 2. 动作对齐:不同机器人关节构造各异。它让模型不再死记“关节转几度”,而是统一学习“机械手在三维空间该怎么动”,实现感知与动作对齐。 3. 时序对齐:抹平不同人操作时的快慢差异,让模型专注学习任务的核心步骤。
实测证明,即使在视角改变、场景变换等干扰下,Dexterity-BEV依然表现稳定,能完成折纸盒、叠衣服等复杂真实任务。
总之,Dexterity-BEV为机器人建立了一套统一的“数据普通话”。只有底层数据互通,具身智能才能真正踏上规模化爆发的快车道。
原文链接
本文链接:https://kx.umi6.com/article/36507.html
转载请注明文章出处
相关推荐
换一换
橡木果发布“本能驱动”技术路线,开辟自下而上具身智能新范式
2026-06-03 12:17:26
寻找最强具身大脑!全球机器人顶会ICRA开启报名,智元全程陪跑带你拿奖
2026-03-23 16:26:23
独家 | 华为19级天才少年赵立晨离职创业,瞄准具身 Agentic OS
2026-04-22 13:09:33
华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资
2026-05-25 11:24:38
深圳:支持建设具身智能技术试验场
2026-02-12 19:43:39
刚刚,机器人练成了宁次的「白眼」:∞帧画面边看边3D重建我们的世界!
2026-04-16 22:21:46
银河通用LDA定义全域数据利用范式,跨本体世界动作大模型开启具身GPT-2时刻
2026-04-29 11:13:21
魔法原子登陆硅谷,行业首个「自进化具身大脑」发布
2026-05-11 16:20:19
有余凯不投的地平线离职创业员工吗?
2026-06-07 21:50:41
物理优先+VLA闭环进化:高德ABot-World世界模型,破解具身智能零样本泛化难题
2026-04-21 17:14:35
西湖大学王东林团队论文:机器人需要“通古今,知未来”丨CVPR 2026
2026-03-24 11:47:03
一个GPT Plus会员的钱,够机器人跑一个月世界模型了
2026-06-04 13:05:17
它石智航Pre-A轮融资4.55亿美元 破中国具身智能领域单轮融资纪录
2026-04-16 11:59:56
801 文章
740378 浏览
24小时热文
更多
-
2026-06-12 14:38:17 -
2026-06-12 14:36:27 -
2026-06-12 14:34:03