1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

你的模型真的会“举一反三”吗?RoboChallenge Table30 V2发布,泛化时代来临

具身智能正面临关键挑战:模型是否具备通用泛化能力,还是仅限于单一任务的过拟合?为解答这一问题,RoboChallenge正式推出Table30 V2,旨在通过“任务升级、评测升级和系统升级”三大维度,构建下一代具身智能的大规模真机泛化评测体系。

任务升级:应对真实世界的复杂性
Table30 V2新增18个双臂灵巧操作任务,与保留的12个经典任务共同组成30个高难度评估场景。这些任务涵盖软体物体(如绳索、布料)处理、工具使用与空间交互、双臂协作等复杂操作,挑战模型的空间推理、自适应控制及物理常识理解能力。此外,硬件平台引入新一代DOS-W1移动双臂系统,并兼容经典Aloha系统,验证模型在不同硬件配置下的鲁棒性。

评测升级:从单点突破到全维泛化
Table30 V2摒弃了单一任务优化模式,全面支持多任务模型评估,并引入零样本测试(Zero-shot),要求模型在未见过的物体、环境或动态变化中展现真正的理解力。同时,评测体系扩展至域外(Out-of-Domain)测试,通过改变桌面高度或替换背景等方式,探索模型的边界能力。

系统升级:效率提升300%
为加速科研迭代,Table30 V2大幅优化底层基础设施,吞吐量提升3倍,任务准备时间显著缩短。排行榜新增“完成时间”作为评分维度,推动研究者优化执行效率,而非单纯依赖推理时间换取成功率。

诚邀参与:RoboChallenge CVPR 2026竞赛启动
Table30 V2将作为CVPR 2026 Workshop竞赛预览版首秀,参赛者可在真实机器人集群上验证模型性能。竞赛结束后,评测平台将持续开放,助力全球研究者攀登具身智能的泛化高峰。

详情请关注:https://robochallenge.cn/competition

原文链接
本文链接:https://kx.umi6.com/article/34092.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
2025年的冬天,上海凭什么被称为“世界具身智能第一战场”?
2025-12-05 13:27:12
图灵奖得主姚期智:具身智能发展要从模仿走向推理
2025-12-14 23:03:37
打造具身机器人「通用AI大脑」,卓世科技完成数亿元Pre-IPO轮融资
2026-02-03 02:16:00
蚂蚁灵波开源具身大模型LingBot-VLA,跨本体跨任务泛化能力创新高
2026-01-28 12:12:41
独家 | 华为前高管刘武龙创立具身公司贝塔无限,已完成近亿元种子轮融资
2026-03-12 11:31:25
无垠拓界 基筑未来|无问智科重磅发布业界首个物理AI数据基座平台
2026-03-06 15:07:52
自变量王潜:具身智能是物理世界的独立基础模型|MEET2026
2025-12-21 20:00:28
商汤科技:将与大晓机器人、中科曙光共建国产化“算力基础设施+世界模型+具身智能 ”生态
2025-12-18 15:54:14
工信部:将发布人形机器人与具身智能综合标准化体系建设指南
2026-01-21 12:07:04
魔法原子,105亿瞄准具身智能终局
2026-03-13 15:19:53
嚯,具身智能和脑机接口在康复医疗合体了
2026-01-30 11:20:07
具身智能,没在元年落地
2025-12-11 08:36:16
理想自动驾驶负责人郎咸朋回应宇树王兴兴对 VLA 质疑:空谈架构不如看疗效
2025-12-10 18:00:42
24小时热文
更多
扫一扫体验小程序