标题:上海AI实验室推出首个「通才」机器人大脑:看懂世界+空间推理+精准操控全搞定
正文:机器人的新大脑框架来了!上海人工智能实验室联合多家机构提出了全新通用具身智能大脑框架——Visual Embodied Brain(简称VeBrain)。该模型通过整合视觉感知、空间推理和机器人控制能力,使机器人能够像人类一样“看到-思考-行动”。
相比现有多模态大模型(MLLM)和视觉-语言-动作(VLA)模型,VeBrain具备多项亮点:统一三类任务的语言建模范式,将机器人控制转化为常规2D空间文本任务;提出“机器人适配器”,包括关键点追踪、动作控制、技能执行及动态接管模块,实现精准映射;构建高质量多能力数据集VeBrain-600k,涵盖60万条指令数据,提升组合推理能力。
测试显示,VeBrain在视觉感知、空间推理和机器人控制能力上均达到最先进水平。其架构通过关键点检测与技能识别重构机器人控制任务,实现感知、推理、控制三大能力的统一建模路径。此外,机器人适配器模块确保MLLM与机器人间的闭环通信,增强动态环境下的稳定性和鲁棒性。
VeBrain-600k数据集包含20万条多模态理解数据、31.2万条空间推理数据及8.8万条机器人控制数据,通过链式思维标注大幅提升任务复杂度。实验表明,VeBrain在多模态理解、空间推理和机器人控制任务中实现了最佳权衡性能,平均提升31.5%,并在多个基准测试中超越当前最强开源模型。
原文链接
本文链接:https://kx.umi6.com/article/19780.html
转载请注明文章出处
相关推荐
换一换
30余位产学研领袖确认出席!2025甲子引力嘉宾阵容第二弹|甲子引力
2025-11-19 15:24:06
融资数亿、营收过亿!黄仁勋频频关注的具身赛道隐形冠军浮出水面
2025-11-19 15:21:46
AI投资中场战事:人才战、信仰分歧和超级机遇
2025-09-02 10:29:16
干家务一小时挣1000元,具身智能时代人类新岗位
2025-10-24 12:34:34
18岁华人开源成果,火爆具身智能赛道
2025-11-18 15:25:42
具身智能:泡沫破灭的另一种表达叫技术收敛
2025-09-23 21:24:07
图片生成仿真!这个AI让3D资产「开箱即用」,直接赋能机器人训练
2025-11-23 13:05:50
对话逐际动力张巍:造机器人很容易,关键是用起来
2025-08-28 13:21:03
具身智能落地茶颜悦色,“新店员”刷屏了
2025-10-24 16:46:05
北京人形机器人创新中心开源 Pelican-VL 1.0 模型,号称“全球最强”
2025-11-14 08:48:49
黄仁勋女儿直播亮相,聊了具身智能
2025-10-16 18:58:20
具身智能基础模型企业极佳视界完成新一轮亿元级A1轮融资
2025-11-03 15:32:13
人类技能大师首次担任机器人比赛裁判,2025 国际具身智能技能大赛 12 月举行
2025-11-29 20:34:57
572 文章
376197 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57