1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

在机器人领域,“通用智能”的探索正在火热进行。MIT的何恺明和Lirui Wang等人最近在“通用数据”上取得进展,使机器人离“通用大脑”的目标更近一步。

以往,训练机器人需要针对每种任务和环境单独采集数据,导致数据难以通用,训练中存在大量重复劳动。MIT这支团队另辟蹊径,试图让现有数据实现“通用”。

他们提出了名为“异构预训练Transformers”(HPT)的新架构,将不同来源的数据对齐为共享的“语言”,让生成式AI模型能够理解这些数据。HPT不仅能处理视觉传感器数据,还能处理机械臂位置编码器的原始信号,从而实现数据的通用化。

HPT的优势在于通用性高、高效且低成本。所需任务专用数据量较少,HPT在模拟和实际测试中表现优异,性能比传统训练方式提升了20%以上。团队还建立了一个庞大的数据集,包括52个数据集和20万条机器人轨迹,涵盖人类演示视频和模拟数据。

HPT借鉴了GPT-4等大语言模型的思路,采用“大规模预训练+少量微调”的模式。在预训练阶段,只调整Trunk参数,而在微调阶段根据具体任务调整Stem和Head部分。此外,HPT还支持处理传感器采集的原始信号,扩大了数据使用范围。

研究团队将视觉和本体感知信号作为等重要数据源进行“通用”处理,使机器人能以“通用智能”的方式理解任务。例如,在清扫任务中,微调的HPT模型任务成功率远高于只依赖视觉模型的VC-1。

HPT架构分为Stem、Trunk和Head三部分,分别对应数据输入层、共享中间层和任务输出层。Stem将传感器和视觉数据转换为标准化的令牌序列,Trunk将这些令牌转化为通用的潜在表示,Head则将潜在表示转化为具体动作指令。

通过这种方法,研究团队希望最终实现“通用机器人大脑”,让机器人训练变得像下载APP一样简单。

原文链接
本文链接:https://kx.umi6.com/article/8477.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样
2024-11-08 16:31:48
成立仅一年,估值108亿:一把融了21亿
2024-07-16 13:45:16
这家估值15亿美元的人工智能公司正在为机器人打造一个“通用大脑”
2024-07-16 20:29:22
AI 的下一个战场:小模型崛起
2025-09-05 21:26:34
AI如何让获客成本直降80%,利润翻三倍?
2025-09-05 14:21:15
美团将上线AI搜索功能:基于用户行为与需求进行智能匹配
2025-09-05 19:24:24
Waymo将于今年秋季在圣何塞机场测试无人驾驶汽车
2025-09-05 09:16:13
AI撬动中国经济新范式
2025-09-04 21:07:55
OpenAI 研究人员宣称已破解模型“幻觉”难题:现有评估方式在鼓励 AI“瞎蒙”
2025-09-06 16:36:08
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此
2025-09-06 12:37:03
视频理解新标杆,快手多模态推理模型开源:128k上下文+0.1秒级视频定位+跨模态推理
2025-09-05 22:26:24
OpenAI 明年杀入招聘市场,将帮助具备 AI 技能的人才找到工作
2025-09-05 16:21:28
AI生成苹果Metal内核,PyTorch推理速度提升87%
2025-09-05 11:17:03
24小时热文
更多
扫一扫体验小程序