标题:训具身模型的问题,数据采集时就已注定
正文:
“我们只交付100%可复现的轨迹。”在鹿明机器人媒体沟通会上,联席CTO丁琰分享了具身智能数据采集的现状、困境及新兴技术UMI(Universal Manipulation Interface)。他强调,许多团队认为模型训练失败是卡在训练阶段,但问题往往在数据生成时就埋下了。后续堆算力和模型,只是对错误输入的加速。
丁琰的研究方向是机器人学与具身智能,2024年3月从纽约州立大学博士毕业,去年底加入鹿明前,曾任一星机器人CTO和上海AI Lab研究员。他从2024年起投入UMI研究,是大陆最早涉足该领域的人之一。UMI的核心是用与具体机器人解耦的方式记录人类操作行为,将“意图+轨迹+感知”统一到通用接口中,供不同机器人学习复现。
具身智能的数据难题有四种解决方式:遥操作数据(如智元机器人)、仿真数据(银河通用机器人)、人类视频数据(它石智能)和UMI(鹿明为代表)。鹿明推出了FastUMI Pro,一款无本体数采硬件,适配主流机械臂,重量仅600多克,却能夹起两三公斤物品,覆盖工厂与家庭场景。其空间精度达1mm,号称“全球最高”。
然而,具身数据采集存在痛点:一是成本高昂,美国每小时采集成本为100-200美元;二是效率低下,遥操每小时仅能采集35条数据,且因设备差异导致数据孤岛问题。
丁琰指出,多数UMI数据无法用于训练的原因并非算法或规模不足,而是数据本身不合格。高质量UMI数据需满足画面与动作严格对齐、传感器毫秒级同步,并能在物理空间中复现。然而,现有设备硬件性能差、模块拼凑设计导致帧率抖动和数据质量低,难以满足要求。此外,“脏数据”(低信息密度)和“废数据”(缺乏技巧的自然行为)也限制了模型训练。
UMI是一个强耦合系统,硬件、数据和算法环环相扣,任何单点失效都会影响模型性能。为此,丁琰团队开发了FastUMI系列,包括工业级系统FastUMI、首个大型UMI数据集FastUMI 100K,以及应用于“狗+臂”构型机器人的Fastumi-MLM。这些工作推动了UMI技术从学术走向工业应用,为具身智能发展提供了重要支持。
-
2026-01-09 16:25:59 -
2026-01-09 16:25:42 -
2026-01-09 16:22:49