1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:上海AI实验室推出首个「通才」机器人大脑:看懂世界+空间推理+精准操控全搞定

正文:机器人的新大脑框架来了!上海人工智能实验室联合多家机构提出了全新通用具身智能大脑框架——Visual Embodied Brain(简称VeBrain)。该模型通过整合视觉感知、空间推理和机器人控制能力,使机器人能够像人类一样“看到-思考-行动”。

相比现有多模态大模型(MLLM)和视觉-语言-动作(VLA)模型,VeBrain具备多项亮点:统一三类任务的语言建模范式,将机器人控制转化为常规2D空间文本任务;提出“机器人适配器”,包括关键点追踪、动作控制、技能执行及动态接管模块,实现精准映射;构建高质量多能力数据集VeBrain-600k,涵盖60万条指令数据,提升组合推理能力。

测试显示,VeBrain在视觉感知、空间推理和机器人控制能力上均达到最先进水平。其架构通过关键点检测与技能识别重构机器人控制任务,实现感知、推理、控制三大能力的统一建模路径。此外,机器人适配器模块确保MLLM与机器人间的闭环通信,增强动态环境下的稳定性和鲁棒性。

VeBrain-600k数据集包含20万条多模态理解数据、31.2万条空间推理数据及8.8万条机器人控制数据,通过链式思维标注大幅提升任务复杂度。实验表明,VeBrain在多模态理解、空间推理和机器人控制任务中实现了最佳权衡性能,平均提升31.5%,并在多个基准测试中超越当前最强开源模型。

原文链接
本文链接:https://kx.umi6.com/article/19780.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
它石智航Pre-A轮融资4.55亿美元 破中国具身智能领域单轮融资纪录
2026-04-16 11:59:56
两个月连获两轮数亿元融资 深度机智以全栈自主路线加速国产物理AI基座模型落地
2026-06-27 00:28:42
具身智能首次独立成馆 2026世界智能产业博览会今日开幕
2026-05-28 13:24:39
让机器人行动更有依据:复旦等提出 GuidedVLA,提升 VLA 可控可解释能力
2026-06-08 11:27:33
4.55亿美金!中国具身智能最大单笔融资诞生,高瓴红杉联手押注具身大脑
2026-04-17 16:08:43
星海图创始人高继扬:具身智能三层技术路线,没有捷径可走
2026-06-17 19:52:45
头部具身大脑公司再获数亿美元融资!世界模型路线,15家VC抢着投
2026-06-17 15:41:50
首日10w+!跨维智能赋能合作伙伴,商业服务小站“五一”多城齐开
2026-05-06 13:16:22
刚刚,全球⾸个“事件级预测”具身智能世界模型来了!
2026-05-29 16:12:55
机器人全栈操作系统!老黄率先抛出“具身版安卓”
2026-06-23 14:38:31
72天,从0到千万小时产能,这个具身「新锐派」凭什么接管数据赛道?
2026-04-16 22:25:21
18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场
2026-04-17 15:04:30
BEV 杀入具身智能:跨维把机器人数据带上 Scaling 快车道
2026-06-12 12:28:26
24小时热文
更多
扫一扫体验小程序