标题:北交大 x 小米 EV 团队:世界模型在自动驾驶中的可靠性探讨
正文:
自动驾驶研究正向世界模型演进,但一个核心问题逐渐显现:论文中的性能提升是否真正转化为真实驾驶环境中的鲁棒性?近年来,世界模型在视觉预测与场景生成指标上取得显著进展,但在工程实践中,这些模型难以支撑长期决策、复杂交互和安全约束并存的真实驾驶系统。
问题根源在于实验范式与评测目标的错位:我们验证的是模型预测的“像不像”,还是系统的“稳不稳”?北京交通大学联合小米汽车团队在论文《Progressive Robustness-Aware World Models in Autonomous Driving: A Review and Outlook》中,对这一问题进行了系统性审视。论文并未提出新模型,而是基于大量实验结果,重构了一套以鲁棒性为核心的分析框架,揭示了当前研究中的关键断层。
通过对生成式世界模型实验结果的梳理,论文确认了一个矛盾事实:尽管模型在视觉预测和场景生成等任务上的定量指标持续进步,但这种进步并未线性转化为驾驶安全或系统稳定性的提升。许多模型在短期预测中表现良好,但随着预测时间延长,场景结构和运动轨迹逐渐偏离合理范围,带来潜在风险。这表明,现有评测体系无法充分刻画自动驾驶所需的鲁棒性维度。
进一步分析发现,基于点云与 Occupancy 表征的世界模型表现出更强的一致性和稳定性,尤其在空间重建精度和规划模块输入方面。此外,开环与闭环评测的对比揭示了另一个关键问题:在开环实验中表现优秀的模型,在闭环系统中往往暴露出能力边界。小幅偏差在反馈机制中逐步放大,导致系统性能下降。因此,开环和闭环评测应被视为互补层级,而非简单替代关系。
论文还总结了一系列证据,表明世界模型的价值更多体现在增强系统整体能力,而非单一任务性能。例如,在可控生成、零样本泛化和跨任务迁移等实验中,世界模型展现了实质性收益。
这篇论文采用非传统实验范式,通过重新组织已有实验结果,构建了一套检验研究方向本身的逻辑。作者强调,未来的关键突破不仅在于提升开环预测精度,更在于设计更合理的实验与评测体系,以弥合开环与闭环之间的能力断层。
团队由贾飞阳博士研究生担任第一作者,贾彩燕教授为通讯作者之一。贾彩燕教授现任北京交通大学计算机与信息技术学院教授,主持多项国家级科研项目,在机器学习与自动驾驶领域有深厚积累。
论文地址:https://doi.org/10.36227/techrxiv.176523308.84756413/v1
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18