卡帕西:强化学习很糟糕,但其他所有方法都更糟
近日,特斯拉前AI总监、OpenAI创始成员卡帕西在一场近两个半小时的访谈中,深入探讨了AI领域的多个关键问题,包括强化学习的局限性、通用人工智能(AGI)的未来,以及自动驾驶技术的挑战。他还分享了对未来教育的看法。
AGI还需十年
卡帕西认为,尽管像Claude、Codex等早期智能体已展现出惊人能力,但它们距离理想状态仍有很大差距。现有系统缺乏多模态能力、持续学习能力和复杂任务操作能力。他预计,要让智能体达到与人类协作的水平,还需要大约十年时间。
LLM的认知缺陷
在编程领域,卡帕西指出当前大语言模型(LLM)存在显著缺陷。这些模型倾向于将代码改造成生产级标准,但忽视了特定项目的需求,导致冗余和复杂性增加。他认为,现有模型的能力被过度夸大,仍需大幅改进。
强化学习的问题
卡帕西直言强化学习“很糟糕”,但其他方法更差。以解数学题为例,强化学习通过大量尝试找到正确答案,却对错误步骤也进行强化,充满噪声且不合理。相比之下,人类会复盘并优化过程,而当前模型缺乏这种机制。
AGI与经济增长
关于AGI的影响,卡帕西认同OpenAI最初的定义,即能完成任何经济价值任务且超越人类水平的系统。他认为AGI不会带来突然的智力爆炸,而是延续历史GDP约2%的增长趋势,逐步替代部分人类工作。
自动驾驶的漫长攻坚
谈及特斯拉自动驾驶项目,卡帕西表示,从演示到产品化极其困难,尤其是失败代价高昂的场景。每提升一个可靠性数量级(如从90%到99%),都需要巨大努力,而真正的产品必须应对现实中的各种边缘情况。
教育的未来
作为全职教育家,卡帕西希望打造一所现代化的顶尖学府,提供“导师体验”。他强调一对一教学的重要性,认为优秀导师能快速判断学生水平并提供适度挑战。他还计划开发一门顶级AI课程,让学生获得最佳学习体验。
这场访谈干货满满,引发广泛讨论。有人赞同卡帕西的观点,也有人认为编码智能体已足够可靠。你怎么看?
参考链接:https://www.dwarkesh.com/p/andrej-karpathy
.png)

-
2025-10-23 02:55:30
-
2025-10-23 01:55:15
-
2025-10-23 00:54:02