1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

强化学习之父Richard Sutton近期指出,大型语言模型(LLM)的主导地位只是暂时现象,未来五年甚至十年内不会是技术前沿。他在新加坡国立大学120周年校庆演讲中再次强调,模仿人类思维的AI短期内可能提升性能,但从长远来看会阻碍研究进展。

Sutton在19年出版的《痛苦的教训》中就提到,单纯依赖人类数据训练的AI难以实现突破性创新。他近期发表的论文《欢迎来到体验时代》进一步阐述了这一观点,并提出扩展计算能力才是关键。

他认为,AI应从依赖人类数据转向通过自主交互获取“体验数据”,从而实现自我进化和创新。例如,AlphaGo在围棋比赛中展现出超越人类的策略,正是这种体验式学习的结果。未来AI将进入“体验时代”,通过不断实践和反馈提升能力,探索未知领域。

此外,Sutton主张采用去中心化的合作模式,让不同目标的AI自主协作,如同人类社会中的经济体系。他鼓励将AI视为推动设计进化的工具,而非单纯的产物。

Sutton的观点引发热烈讨论,支持者认为LLM可能触及瓶颈,而反对者则认为其仍是通向通用人工智能的重要一步。

原文链接
本文链接:https://kx.umi6.com/article/20004.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍
2025-06-24 17:19:19
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B
2025-07-20 15:05:31
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
2025-06-05 15:52:55
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
2025-08-18 17:48:45
OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
2025-06-20 21:05:08
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
2025-10-20 16:09:01
全新合成框架SOTA:强化学习当引擎,任务合成当燃料,蚂蚁港大联合出品
2025-10-01 18:47:16
上交博士最新思考:仅用两个问题讲清强化学习
2025-11-10 18:29:12
发自 凹非寺量子位 | 公众号 QbitAI 奥特曼点名表扬了两个波兰人。 没有他们,OpenAI就不是今天的样子。 他们是OpenAI首席科学家Jakub Pachocki以及头衔为“Technical Fellow”的Szymon Sidor。 △左:Jakub Pachocki,右:Szymon Sidor 两人不仅是波兰老乡,而且是高中同学,读博时分别选择了计算机科学和机器人,后来又在OpenAI重聚。 在ChatGPT风靡全球、每天服务数亿用户的今天,奥特曼感慨大多数人永远不会想到背
2025-09-09 18:18:27
Meta 推 LlamaRL 强化学习框架:全异步分布设计,训练 AI 模型提速 10.7 倍
2025-06-11 16:14:21
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
2025-07-11 11:34:40
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
2025-05-01 13:22:40
24小时热文
更多
扫一扫体验小程序