突破视觉仿真算力瓶颈！新一代具身智能仿真框架开源：高吞吐并行高保真渲染助力规模化训练

2026-05-01 15:36:25

未来笔触

发布在

科普

阅读：360

突破视觉仿真算力瓶颈！新一代具身智能仿真框架开源：高吞吐并行高保真渲染助力规模化训练

清华大学智能产业研究院（AIR）DISCOVER Lab联合多家机构推出了GS-Playground，一套专为视觉中心机器人学习设计的通用多模态仿真框架。该框架深度融合了高吞吐量并行物理仿真与高保真视觉渲染，解决了传统仿真平台在“看得真”和“训得快”之间的取舍难题，为具身智能研究提供了高效的基础设施。

GS-Playground具备全场景原生兼容性，支持CPU/GPU双后端及Windows/Linux/macOS全系统运行，适配四足机器人、人形机器人、机械臂等多种形态，开箱即用。其自研高性能并行物理引擎采用广义坐标下的速度-冲量动力学公式，通过混合互补问题（MCP）建模接触与摩擦，并结合投影高斯-赛德尔（PGS）求解器实现稳定求解。实验表明，在复杂多体交互任务中，GS-Playground相比主流方案实现了显著的性能提升。

针对高保真渲染带来的内存与算力挑战，团队开发了内存高效的Batch 3DGS渲染技术，通过高效剪枝策略减少90%以上的高斯点数量，同时保持视觉质量几乎无损。单张RTX 4090 GPU可实现最高10000 FPS的渲染吞吐量，支持2048个场景并行渲染，极大提升了大规模训练效率。

此外，GS-Playground还引入自动化“Sim-Ready”Real2Sim工作流，仅需输入单张RGB图像即可快速生成仿真就绪的数字资产，大幅降低了真实到仿真的转换门槛。基于此，团队构建了Bridge-GS数据集，验证了其对不同场景的强泛化能力。

实验结果表明，GS-Playground实现了零微调的仿真到真实迁移，无论是四足机器人运动、视觉导航还是机械臂抓取任务，均能在真实场景中直接部署并取得优异表现。

未来，GS-Playground将持续优化，推动具身智能领域的创新与发展。项目已正式开源，提供高性能、易使用的核心基础设施，助力机器人策略学习的进一步突破。

项目主页：
https://gsplayground.github.io
论文链接：
https://arxiv.org/abs/2604.25459
仓库链接：
https://github.com/discoverse-dev/gs_playground

原文链接

本文链接：https://kx.umi6.com/article/35422.html

转载请注明文章出处

仿真框架