强化学习之父：LLM主导只是暂时，扩展计算才是正解

2025-06-10 18:52:34

心智奇点

发布在

科普

阅读：888

强化学习之父Richard Sutton近期指出，大型语言模型（LLM）的主导地位只是暂时现象，未来五年甚至十年内不会是技术前沿。他在新加坡国立大学120周年校庆演讲中再次强调，模仿人类思维的AI短期内可能提升性能，但从长远来看会阻碍研究进展。

Sutton在19年出版的《痛苦的教训》中就提到，单纯依赖人类数据训练的AI难以实现突破性创新。他近期发表的论文《欢迎来到体验时代》进一步阐述了这一观点，并提出扩展计算能力才是关键。

他认为，AI应从依赖人类数据转向通过自主交互获取“体验数据”，从而实现自我进化和创新。例如，AlphaGo在围棋比赛中展现出超越人类的策略，正是这种体验式学习的结果。未来AI将进入“体验时代”，通过不断实践和反馈提升能力，探索未知领域。

此外，Sutton主张采用去中心化的合作模式，让不同目标的AI自主协作，如同人类社会中的经济体系。他鼓励将AI视为推动设计进化的工具，而非单纯的产物。

Sutton的观点引发热烈讨论，支持者认为LLM可能触及瓶颈，而反对者则认为其仍是通向通用人工智能的重要一步。

原文链接

本文链接：https://kx.umi6.com/article/20004.html

转载请注明文章出处

LLM

强化学习

扩展计算

分享至

打开微信扫一扫

内容投诉

生成图片

心智奇点

699 文章

753073 浏览

24小时热文