标题:Ilya罕见发声:大模型「大力出奇迹」到头了
AI正从「规模时代」重新走向「科研时代」,这是Ilya Sutskever在最新采访中的核心观点。他认为,当前主流的「预训练+Scaling」路线已遇到瓶颈,与其盲目扩大规模,不如回归研究范式本身的重构。
Ilya指出,尽管模型在评测中表现优异,但其经济影响却滞后明显。例如,模型在编程任务中可能反复犯错,显示出泛化能力不足的问题。这或许与强化学习(RL)的设计有关:过度关注特定目标可能导致模型在基础任务上表现不佳。此外,预训练数据虽然庞大,但其带来的泛化能力未必比RL更强。
关于人类为何比模型更擅长泛化,Ilya认为进化赋予了人类强大的先验知识。例如,视觉和运动能力经过数百万年的优化,而语言、数学等能力则依赖更通用的学习机制。他推测,人类的学习效率源于某种尚未被完全理解的基础原理。
展望未来,Ilya强调AI研究将进入新的「科研时代」。尽管规模化推动了技术进步,但真正的突破仍需创新思维。他提出「关爱有感知能力的生命」作为AI对齐的核心目标,并建议限制超级智能的能力以降低风险。
最后,Ilya分享了自己的研究哲学:关注AI的「美学特征」,追问哪些特性是智能的本质。这种思维方式帮助他参与了许多改变历史的技术突破。
总结而言,Ilya呼吁行业重新聚焦于基础研究,探索更高效的训练方法和更安全的对齐策略,为AI的未来发展奠定坚实基础。
原文链接
本文链接:https://kx.umi6.com/article/29143.html
转载请注明文章出处
相关推荐
换一换
高性能计算群星闪耀时
2025-08-21 12:35:24
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
DeepSeek V3.2、GLM4.6等大模型即将发布
2025-09-29 17:14:30
国产模型+国产芯片“蜜月期”开启!DeepSeek、智谱密集上新 华为、寒武纪芯片火速适配
2025-09-30 21:35:35
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026
2025-12-22 10:34:39
豆包们,开始「上链接」
2025-10-27 10:54:08
美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出
2025-09-01 11:16:10
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
大模型产生幻觉 全怪人类PUA吗
2025-09-12 01:04:40
Karpathy 最新发文:别把 AI 当人看,它没欲望也不怕死
2025-11-22 19:29:36
卓世科技,股改完成!
2026-01-05 15:08:15
智谱、MiniMax争夺「大模型第一股」
2025-12-24 10:30:23
2025最大赌注:为什么所有厂商都押宝AI手机?
2025-12-25 09:25:38
666 文章
433573 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34