1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight

一个简单的迷宫导航任务,却让许多模型“原形毕露”。Diffuser和Diffusion Forcing在测试中表现糟糕,通关率极低。而一种全新方法——蒙特卡洛树扩散(Monte Carlo Tree Diffusion, MCTD)却以100%的通关率脱颖而出。该方法由图灵奖得主Yoshua Bengio及其团队提出,将经典的蒙特卡洛树搜索(MCTS)与当前热门的扩散模型结合,突破了扩散模型在长程任务推理中的可扩展性瓶颈,并成功入选ICML 2025 Spotlight。

复杂决策任务的核心挑战在于平衡探索未知可能性与利用已知最佳方案。扩散模型擅长全局一致的序列生成,但缺乏主动探索未来路径的能力;而MCTS则能高效权衡探索与利用。MCTD将扩散模型的全局生成能力与MCTS的局部探索能力结合,通过将轨迹划分为多个子规划并实施差异化的去噪调度,实现了长程规划中的探索与利用平衡。

MCTD的具体运行机制包括四个阶段:Selection、Expansion、Simulation和Backpropagation。Selection阶段选择最有潜力的子规划节点;Expansion阶段生成新的子规划节点;Simulation阶段快速生成粗略轨迹并评估其价值;Backpropagation阶段更新节点信息以指导后续搜索。这种方法不仅提升了规划效率,还在迷宫导航、机械臂操作等任务中表现出色。

然而,MCTD因深度推理方式导致计算成本较高,尤其在大规模搜索空间中效率较低。为此,研究团队推出了Fast-MCTD框架,在特定任务上推理速度提升100倍。Fast-MCTD通过并行MCTD和稀疏MCTD优化了树搜索和去噪过程:并行MCTD引入冗余感知选择和批处理策略,显著提高了并行性;稀疏MCTD通过轨迹粗化减少rollout长度,降低了计算开销。

实验表明,Fast-MCTD在保持或提升性能的同时,实现了数量级的速度提升,成为更实用的解决方案。两篇论文的一作是来自韩国科学技术院(KAIST)的博士生尹在植,其导师安成镇教授在人工智能领域有深厚研究背景,曾师从Yoshua Bengio。

论文链接:
[1] https://arxiv.org/pdf/2502.07202
[2] https://arxiv.org/pdf/2506.09498

原文链接
本文链接:https://kx.umi6.com/article/22832.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
重大突破!微软发布“自我进化”,帮小模型超OpenAI-o1
2025-01-13 10:50:38
冲破 AGI 迷雾,蚂蚁看到了一个新路标
2025-09-29 11:08:37
北交开源 o1 代码版:强化学习 + 蒙特卡洛树搜索,放出源代码、精选数据集以及衍生模型
2024-12-09 13:27:10
扩散语言模型写代码!速度比自回归快10倍
2025-07-10 17:26:44
DiT突遭怒喷,谢赛宁淡定回应
2025-08-20 17:19:58
材料设计重大突破!微软发布创新大模型,准确率提升10倍!
2025-01-17 16:19:05
刚刚,OpenAI发布sCM提升50倍效率,扩散模型重大技术突破!
2024-10-25 10:40:17
OpenAI宋飏被Meta挖跑了!扩散模型崛起关键人物,加入MSL再会师清华校友赵晟佳
2025-09-25 22:11:00
图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight
2025-08-01 14:00:21
突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升
2025-01-11 12:37:26
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式
2024-11-05 16:03:16
12秒生成1万token!谷歌推出文本「扩散模型」Gemini Diffusion,研究员:演示都得降速看
2025-05-22 15:30:59
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
2025-02-18 13:14:03
24小时热文
更多
扫一扫体验小程序