“神经-符号”融合规划器性能超越o1:借鉴人类运动学习机制
还在为科研中的材料组合方案耗时费力?中国科学院磐石研发团队提出了一种新型“神经-符号”融合规划器,结合神经规划和符号规划的优势,显著提升规划效率与精准性。
该规划器借鉴了人类运动学习中的闭环反馈机制(Knowledge of Result, KR),构建双向规划机制(KRCL)。通过正向神经规划生成动作序列,反向符号规划识别目标并提供反馈,形成动态错误检测与纠正闭环。相比传统方法,其在表达能力、适应性和可解释性上均有显著提升,且仅在需要时激活反馈,减少对冗余信息的依赖。
系统将神经网络的灵活性与符号推理的准确性相结合。正向神经规划器生成动作序列,反向符号规划器推理目标并校正错误,二者通过文本相似度量化反馈强度,确保规划器高效学习与精准推理。同时,引入自我控制机制,根据任务难度和模型表现决定是否接收反馈,避免过度依赖KR,提升自主性和长期迁移能力。
实验显示,KRCL在国际IPC竞赛的8个代表性任务中,覆盖率和效率均显著优于其他规划器,并在PlanBench基准测试中超越OpenAI o1。论文链接:https://www.sciencedirect.com/science/article/abs/pii/S095070512501086X?via%3Dihub
原文链接
本文链接:https://kx.umi6.com/article/23122.html
转载请注明文章出处
相关推荐
.png)
换一换
“神经-符号”融合规划器性能显著超越o1:借鉴人类运动学习机制
2025-08-06 17:34:32
前首富陈天桥新创公司欲对标DeepSeek 国内AI大牛代季峰加盟
2025-08-06 21:37:46
上海:对达到一定算力租用规模的具身智能企业,给予最高 4000 万元 / 年算力券支持
2025-08-06 11:28:09
腾讯2026校园招聘正式启动,将推出AI产品经理培训生项目
2025-08-06 15:36:18
估值达 5000 亿美元,消息称 OpenAI 就股份出售进行谈判
2025-08-06 10:27:16
工信部副部长熊继军:中方愿与APEC各成员经济体合力推动数字和人工智能创新应用
2025-08-06 21:39:57
英伟达:将深度参与 2025 世界机器人大会
2025-08-06 11:29:18
上海:探索算力和语料作价入股等模式 支持发展面向具身智能的新型金融工具
2025-08-06 10:29:39
全球第一!群核科技InteriorGS数据集霸榜HuggingFace趋势榜
2025-08-06 15:33:56
人形机器人来了,酒店又有一批人要下岗了?
2025-08-06 14:34:44
一天吃透一条产业链:AI 电商
2025-08-06 12:28:51
OpenAI官宣直播活动
2025-08-07 08:50:44
研究显示:AI 解 6x6 数独都费劲,解释决策时还答非所问
2025-08-07 10:46:45
453 文章
99279 浏览
24小时热文
更多

-
2025-08-07 10:48:38
-
2025-08-07 10:47:56
-
2025-08-07 10:47:30