“神经-符号”融合规划器性能显著超越o1：借鉴人类运动学习机制

2025-08-06 17:34:32

元界筑梦师

发布在

科普

阅读：13

“神经-符号”融合规划器性能超越o1：借鉴人类运动学习机制

还在为科研中的材料组合方案耗时费力？中国科学院磐石研发团队提出了一种新型“神经-符号”融合规划器，结合神经规划和符号规划的优势，显著提升规划效率与精准性。

该规划器借鉴了人类运动学习中的闭环反馈机制（Knowledge of Result, KR），构建双向规划机制（KRCL）。通过正向神经规划生成动作序列，反向符号规划识别目标并提供反馈，形成动态错误检测与纠正闭环。相比传统方法，其在表达能力、适应性和可解释性上均有显著提升，且仅在需要时激活反馈，减少对冗余信息的依赖。

系统将神经网络的灵活性与符号推理的准确性相结合。正向神经规划器生成动作序列，反向符号规划器推理目标并校正错误，二者通过文本相似度量化反馈强度，确保规划器高效学习与精准推理。同时，引入自我控制机制，根据任务难度和模型表现决定是否接收反馈，避免过度依赖KR，提升自主性和长期迁移能力。

实验显示，KRCL在国际IPC竞赛的8个代表性任务中，覆盖率和效率均显著优于其他规划器，并在PlanBench基准测试中超越OpenAI o1。论文链接：https://www.sciencedirect.com/science/article/abs/pii/S095070512501086X?via%3Dihub

原文链接

本文链接：https://kx.umi6.com/article/23122.html

转载请注明文章出处

神经-符号融合