综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
让离线强化学习从「局部描摹」变「全局布局」丨ICLR’26
现有生成式离线强化学习方法在处理复杂连续任务时,常因过于关注局部合理性而忽视全局规划,导致生成的轨迹“局部合理但全局偏航”。为解决这一问题,厦门大学与香港科技大学提出了一种名为 MAGE(Multi-scale Autoregressive...
原文链接
加载更多
暂无内容