北交大 x 小米 EV 团队：一次关于世界模型「靠不靠谱」的系统复盘

2025-12-26 12:39:33

数码游侠

发布在

科普

阅读：748

标题：北交大 x 小米 EV 团队：世界模型在自动驾驶中的可靠性探讨

正文：
自动驾驶研究正向世界模型演进，但一个核心问题逐渐显现：论文中的性能提升是否真正转化为真实驾驶环境中的鲁棒性？近年来，世界模型在视觉预测与场景生成指标上取得显著进展，但在工程实践中，这些模型难以支撑长期决策、复杂交互和安全约束并存的真实驾驶系统。

问题根源在于实验范式与评测目标的错位：我们验证的是模型预测的“像不像”，还是系统的“稳不稳”？北京交通大学联合小米汽车团队在论文《Progressive Robustness-Aware World Models in Autonomous Driving: A Review and Outlook》中，对这一问题进行了系统性审视。论文并未提出新模型，而是基于大量实验结果，重构了一套以鲁棒性为核心的分析框架，揭示了当前研究中的关键断层。

通过对生成式世界模型实验结果的梳理，论文确认了一个矛盾事实：尽管模型在视觉预测和场景生成等任务上的定量指标持续进步，但这种进步并未线性转化为驾驶安全或系统稳定性的提升。许多模型在短期预测中表现良好，但随着预测时间延长，场景结构和运动轨迹逐渐偏离合理范围，带来潜在风险。这表明，现有评测体系无法充分刻画自动驾驶所需的鲁棒性维度。

进一步分析发现，基于点云与 Occupancy 表征的世界模型表现出更强的一致性和稳定性，尤其在空间重建精度和规划模块输入方面。此外，开环与闭环评测的对比揭示了另一个关键问题：在开环实验中表现优秀的模型，在闭环系统中往往暴露出能力边界。小幅偏差在反馈机制中逐步放大，导致系统性能下降。因此，开环和闭环评测应被视为互补层级，而非简单替代关系。

论文还总结了一系列证据，表明世界模型的价值更多体现在增强系统整体能力，而非单一任务性能。例如，在可控生成、零样本泛化和跨任务迁移等实验中，世界模型展现了实质性收益。

这篇论文采用非传统实验范式，通过重新组织已有实验结果，构建了一套检验研究方向本身的逻辑。作者强调，未来的关键突破不仅在于提升开环预测精度，更在于设计更合理的实验与评测体系，以弥合开环与闭环之间的能力断层。

团队由贾飞阳博士研究生担任第一作者，贾彩燕教授为通讯作者之一。贾彩燕教授现任北京交通大学计算机与信息技术学院教授，主持多项国家级科研项目，在机器学习与自动驾驶领域有深厚积累。

论文地址：https://doi.org/10.36227/techrxiv.176523308.84756413/v1

原文链接

本文链接：https://kx.umi6.com/article/30808.html

转载请注明文章出处

世界模型