突破视觉仿真算力瓶颈!新一代具身智能仿真框架开源:高吞吐并行高保真渲染助力规模化训练
清华大学智能产业研究院(AIR)DISCOVER Lab联合多家机构推出了GS-Playground,一套专为视觉中心机器人学习设计的通用多模态仿真框架。该框架深度融合了高吞吐量并行物理仿真与高保真视觉渲染,解决了传统仿真平台在“看得真”和“训得快”之间的取舍难题,为具身智能研究提供了高效的基础设施。
GS-Playground具备全场景原生兼容性,支持CPU/GPU双后端及Windows/Linux/macOS全系统运行,适配四足机器人、人形机器人、机械臂等多种形态,开箱即用。其自研高性能并行物理引擎采用广义坐标下的速度-冲量动力学公式,通过混合互补问题(MCP)建模接触与摩擦,并结合投影高斯-赛德尔(PGS)求解器实现稳定求解。实验表明,在复杂多体交互任务中,GS-Playground相比主流方案实现了显著的性能提升。
针对高保真渲染带来的内存与算力挑战,团队开发了内存高效的Batch 3DGS渲染技术,通过高效剪枝策略减少90%以上的高斯点数量,同时保持视觉质量几乎无损。单张RTX 4090 GPU可实现最高10000 FPS的渲染吞吐量,支持2048个场景并行渲染,极大提升了大规模训练效率。
此外,GS-Playground还引入自动化“Sim-Ready”Real2Sim工作流,仅需输入单张RGB图像即可快速生成仿真就绪的数字资产,大幅降低了真实到仿真的转换门槛。基于此,团队构建了Bridge-GS数据集,验证了其对不同场景的强泛化能力。
实验结果表明,GS-Playground实现了零微调的仿真到真实迁移,无论是四足机器人运动、视觉导航还是机械臂抓取任务,均能在真实场景中直接部署并取得优异表现。
未来,GS-Playground将持续优化,推动具身智能领域的创新与发展。项目已正式开源,提供高性能、易使用的核心基础设施,助力机器人策略学习的进一步突破。
项目主页:
https://gsplayground.github.io
论文链接:
https://arxiv.org/abs/2604.25459
仓库链接:
https://github.com/discoverse-dev/gs_playground
-
2026-05-01 17:41:40 -
2026-05-01 15:36:25 -
2026-05-01 15:34:55