强化学习之父Richard Sutton近期指出,大型语言模型(LLM)的主导地位只是暂时现象,未来五年甚至十年内不会是技术前沿。他在新加坡国立大学120周年校庆演讲中再次强调,模仿人类思维的AI短期内可能提升性能,但从长远来看会阻碍研究进展。
Sutton在19年出版的《痛苦的教训》中就提到,单纯依赖人类数据训练的AI难以实现突破性创新。他近期发表的论文《欢迎来到体验时代》进一步阐述了这一观点,并提出扩展计算能力才是关键。
他认为,AI应从依赖人类数据转向通过自主交互获取“体验数据”,从而实现自我进化和创新。例如,AlphaGo在围棋比赛中展现出超越人类的策略,正是这种体验式学习的结果。未来AI将进入“体验时代”,通过不断实践和反馈提升能力,探索未知领域。
此外,Sutton主张采用去中心化的合作模式,让不同目标的AI自主协作,如同人类社会中的经济体系。他鼓励将AI视为推动设计进化的工具,而非单纯的产物。
Sutton的观点引发热烈讨论,支持者认为LLM可能触及瓶颈,而反对者则认为其仍是通向通用人工智能的重要一步。
原文链接
本文链接:https://kx.umi6.com/article/20004.html
转载请注明文章出处
相关推荐
换一换
清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊丨ILCR 2026
2026-02-24 14:48:42
字节Seed发布GR-RL 首次实现真机强化学习穿鞋带
2025-12-02 14:21:13
西交大 x A*STAR 论文:让 AI 学会「保持一致」,多图生成迎来关键突破丨CVPR 2026
2026-03-24 11:45:18
英伟达发布新 RL 范式:受 DeepSeek-R1 启发,重塑 AI 模型外部工具能力
2025-05-14 15:16:49
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
2025-10-23 17:10:54
大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱
2025-07-08 17:52:09
卡帕西:强化学习很糟糕,但其他所有方法都更糟
2025-10-18 15:34:39
OpenAI新模型被曝秘密训练中,o4会是什么样?
2025-06-10 18:54:49
突破多模态奖励瓶颈!中科院清华快手联合提出R1-Reward,用强化学习赋予模型长期推理能力
2025-05-08 18:33:15
4o-mini华人领队也离职了,这次不怪小扎
2025-08-19 16:01:05
LLM能替代数据科学家了?DeepAnalyze帮你告别手动分析数据
2025-11-01 13:29:57
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025-11-05 15:09:36
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
687 文章
601340 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41