1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

你的模型真的会“举一反三”吗?RoboChallenge Table30 V2发布,泛化时代来临

具身智能正面临关键挑战:模型是否具备通用泛化能力,还是仅限于单一任务的过拟合?为解答这一问题,RoboChallenge正式推出Table30 V2,旨在通过“任务升级、评测升级和系统升级”三大维度,构建下一代具身智能的大规模真机泛化评测体系。

任务升级:应对真实世界的复杂性
Table30 V2新增18个双臂灵巧操作任务,与保留的12个经典任务共同组成30个高难度评估场景。这些任务涵盖软体物体(如绳索、布料)处理、工具使用与空间交互、双臂协作等复杂操作,挑战模型的空间推理、自适应控制及物理常识理解能力。此外,硬件平台引入新一代DOS-W1移动双臂系统,并兼容经典Aloha系统,验证模型在不同硬件配置下的鲁棒性。

评测升级:从单点突破到全维泛化
Table30 V2摒弃了单一任务优化模式,全面支持多任务模型评估,并引入零样本测试(Zero-shot),要求模型在未见过的物体、环境或动态变化中展现真正的理解力。同时,评测体系扩展至域外(Out-of-Domain)测试,通过改变桌面高度或替换背景等方式,探索模型的边界能力。

系统升级:效率提升300%
为加速科研迭代,Table30 V2大幅优化底层基础设施,吞吐量提升3倍,任务准备时间显著缩短。排行榜新增“完成时间”作为评分维度,推动研究者优化执行效率,而非单纯依赖推理时间换取成功率。

诚邀参与:RoboChallenge CVPR 2026竞赛启动
Table30 V2将作为CVPR 2026 Workshop竞赛预览版首秀,参赛者可在真实机器人集群上验证模型性能。竞赛结束后,评测平台将持续开放,助力全球研究者攀登具身智能的泛化高峰。

详情请关注:https://robochallenge.cn/competition

原文链接
本文链接:https://kx.umi6.com/article/34092.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
顺丰邮政仓库干活的机器人,顺手拿了个具身高考第一
2026-05-21 13:40:26
具身智能首次独立成馆 2026世界智能产业博览会今日开幕
2026-05-28 13:24:39
再融20亿!星海图把具身智能头部门槛抬到了200亿
2026-04-02 15:00:40
18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场
2026-04-17 15:04:30
具身智能为什么还没真正落地?问题卡在这|沙龙报名
2026-04-16 10:52:19
美团外卖前负责人入局餐饮具身模型,元节智能获千万级种子轮融资
2026-05-23 11:34:26
从看懂世界到做对动作,卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层
2026-06-03 20:34:55
智元:将于4月7日开启 “智元AI发布周” 密集展示具身智能领域AI自研成果
2026-04-03 11:17:24
第一视角效率超过真机,深度机智发布全球首个以人类学习范式构建的具身基座模型
2026-04-07 16:03:27
独家 | 华为19级天才少年赵立晨离职创业,瞄准具身 Agentic OS
2026-04-22 13:09:33
它石智航用“吉尼斯纪录”交卷真干活的具身大脑,丁文超:从来没有Plan B
2026-03-26 11:52:35
深圳:支持建设具身智能技术试验场
2026-02-12 19:43:39
地瓜机器人再获1.5亿美元投资!B轮累计融资2.7亿美元
2026-04-08 14:58:14
24小时热文
更多
扫一扫体验小程序