图灵奖得主加持，蒙特卡洛树搜索×扩散模型杀回规划赛道｜ICML 2025 Spotlight

2025-08-01 14:00:21

智慧轨迹

发布在

科普

阅读：767

标题：图灵奖得主加持，蒙特卡洛树搜索×扩散模型杀回规划赛道｜ICML 2025 Spotlight

一个简单的迷宫导航任务，却让许多模型“原形毕露”。Diffuser和Diffusion Forcing在测试中表现糟糕，通关率极低。而一种全新方法——蒙特卡洛树扩散（Monte Carlo Tree Diffusion, MCTD）却以100%的通关率脱颖而出。该方法由图灵奖得主Yoshua Bengio及其团队提出，将经典的蒙特卡洛树搜索（MCTS）与当前热门的扩散模型结合，突破了扩散模型在长程任务推理中的可扩展性瓶颈，并成功入选ICML 2025 Spotlight。

复杂决策任务的核心挑战在于平衡探索未知可能性与利用已知最佳方案。扩散模型擅长全局一致的序列生成，但缺乏主动探索未来路径的能力；而MCTS则能高效权衡探索与利用。MCTD将扩散模型的全局生成能力与MCTS的局部探索能力结合，通过将轨迹划分为多个子规划并实施差异化的去噪调度，实现了长程规划中的探索与利用平衡。

MCTD的具体运行机制包括四个阶段：Selection、Expansion、Simulation和Backpropagation。Selection阶段选择最有潜力的子规划节点；Expansion阶段生成新的子规划节点；Simulation阶段快速生成粗略轨迹并评估其价值；Backpropagation阶段更新节点信息以指导后续搜索。这种方法不仅提升了规划效率，还在迷宫导航、机械臂操作等任务中表现出色。

然而，MCTD因深度推理方式导致计算成本较高，尤其在大规模搜索空间中效率较低。为此，研究团队推出了Fast-MCTD框架，在特定任务上推理速度提升100倍。Fast-MCTD通过并行MCTD和稀疏MCTD优化了树搜索和去噪过程：并行MCTD引入冗余感知选择和批处理策略，显著提高了并行性；稀疏MCTD通过轨迹粗化减少rollout长度，降低了计算开销。

实验表明，Fast-MCTD在保持或提升性能的同时，实现了数量级的速度提升，成为更实用的解决方案。两篇论文的一作是来自韩国科学技术院（KAIST）的博士生尹在植，其导师安成镇教授在人工智能领域有深厚研究背景，曾师从Yoshua Bengio。

论文链接：
[1] https://arxiv.org/pdf/2502.07202
[2] https://arxiv.org/pdf/2506.09498

原文链接

本文链接：https://kx.umi6.com/article/22832.html

转载请注明文章出处

扩散模型