1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight

一个简单的迷宫导航任务,却让许多模型“原形毕露”。Diffuser和Diffusion Forcing在测试中表现糟糕,通关率极低。而一种全新方法——蒙特卡洛树扩散(Monte Carlo Tree Diffusion, MCTD)却以100%的通关率脱颖而出。该方法由图灵奖得主Yoshua Bengio及其团队提出,将经典的蒙特卡洛树搜索(MCTS)与当前热门的扩散模型结合,突破了扩散模型在长程任务推理中的可扩展性瓶颈,并成功入选ICML 2025 Spotlight。

复杂决策任务的核心挑战在于平衡探索未知可能性与利用已知最佳方案。扩散模型擅长全局一致的序列生成,但缺乏主动探索未来路径的能力;而MCTS则能高效权衡探索与利用。MCTD将扩散模型的全局生成能力与MCTS的局部探索能力结合,通过将轨迹划分为多个子规划并实施差异化的去噪调度,实现了长程规划中的探索与利用平衡。

MCTD的具体运行机制包括四个阶段:Selection、Expansion、Simulation和Backpropagation。Selection阶段选择最有潜力的子规划节点;Expansion阶段生成新的子规划节点;Simulation阶段快速生成粗略轨迹并评估其价值;Backpropagation阶段更新节点信息以指导后续搜索。这种方法不仅提升了规划效率,还在迷宫导航、机械臂操作等任务中表现出色。

然而,MCTD因深度推理方式导致计算成本较高,尤其在大规模搜索空间中效率较低。为此,研究团队推出了Fast-MCTD框架,在特定任务上推理速度提升100倍。Fast-MCTD通过并行MCTD和稀疏MCTD优化了树搜索和去噪过程:并行MCTD引入冗余感知选择和批处理策略,显著提高了并行性;稀疏MCTD通过轨迹粗化减少rollout长度,降低了计算开销。

实验表明,Fast-MCTD在保持或提升性能的同时,实现了数量级的速度提升,成为更实用的解决方案。两篇论文的一作是来自韩国科学技术院(KAIST)的博士生尹在植,其导师安成镇教授在人工智能领域有深厚研究背景,曾师从Yoshua Bengio。

论文链接:
[1] https://arxiv.org/pdf/2502.07202
[2] https://arxiv.org/pdf/2506.09498

原文链接
本文链接:https://kx.umi6.com/article/22832.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI宋飏被Meta挖跑了!扩散模型崛起关键人物,加入MSL再会师清华校友赵晟佳
2025-09-25 22:11:00
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
2024-07-29 16:05:53
扩散语言模型写代码!速度比自回归快10倍
2025-07-10 17:26:44
英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍
2025-06-03 12:54:51
微软 rStar-Math 技术登场:小语言 AI 模型数学推理从“不及格”一跃成为“优等生”
2025-01-11 12:39:34
扩散模型还原被遮挡物体,几张稀疏照片也能”脑补”完整重建交互式3D场景|CVPR’25
2025-04-23 13:56:19
重大突破!微软发布“自我进化”,帮小模型超OpenAI-o1
2025-01-13 10:50:38
MSRA:视觉生成六大技术问题
2024-07-13 12:09:52
材料设计重大突破!微软发布创新大模型,准确率提升10倍!
2025-01-17 16:19:05
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式
2024-11-05 16:03:16
华人团队终结Token危机:扩散模型数据潜力超自回归三倍
2025-08-13 17:38:29
智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等
2024-10-29 16:33:28
VAE再被补刀!清华快手SVG扩散模型亮相,训练提效6200%,生成提速3500%
2025-10-28 15:54:58
24小时热文
更多
扫一扫体验小程序