综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
你的模型真的会“举一反三”吗?RoboChallenge Table30 V2发布,泛化时代来临
具身智能正面临关键挑战:模型是否具备通用泛化能力,还是仅限于单一任务的过拟合?为解答这一问题,RoboChallenge正式推出Table30 V2,旨在通过“任务升级、评测升级和系统升级”三大维度,构...
原文链接
正文:1月30日,全球首个具身智能真机评测平台RoboChallenge发布首份年度报告。报告基于2025 Q4至2026 Q1期间数万次真机测试,揭示了视觉-语言-动作模型在真实物理环境中的能力边界与挑战。平台由原力灵机与Hugging Face联合发起,已部署20台真机集群,并开源Table30数据集,获全球研究者积极响应。报告显示,复杂任务如‘整理纸杯’仍极具挑战,当前最佳模型整体成功率约50%。RoboChallenge将持续迭代,拓展场景与任务,推动具身智能技术突破。平台官网:
原文链接
2026年1月12日,千寻智能的具身智能模型Spirit v1.5在RoboChallenge真机评测榜上以总分66.09、成功率50.33%的成绩超越美国Physical Intelligence的Pi0.5,登顶榜首,成为首个成功率超50%的国产模型。Spirit v1.5在插花、水果入篮、挂牙刷杯等任务中表现优异,尤其在“寻找绿盒”任务中成功率达90%,并以多样化预训练数据策略显著提升泛化能力。团队同步开源模型权重、推理代码及样例,推动研究社区复现与探索。千寻智能由韩峰涛和高阳于2024年创立,致力于通用人形机器人与具身大模型的研发,其技术已在宁德时代产线落地。此次登顶被视为具身智能领域的重要里程碑。
原文链接
10家机构共建具身智能评测体系:RoboChallenge组委会正式成立
人工智能正从“感知智能”迈向“行动智能”,但如何科学评估机器人在真实场景中的能力,成为行业发展的重要挑战。为解决这一问题,Dexmal原力灵机与Hugging Face联合发起的RoboChallenge项目应运而生,并迅速吸...
原文链接
加载更多
暂无内容