姚班学霸、OpenAI姚顺雨：大模型下半场是产品的游戏

2025-04-17 17:47:23

梦境编程师

发布在

科普

阅读：1800

AI趋势正在“中场休息”，之前是训练＞评估，未来将是评估＞训练。这是OpenAI员工、姚班校友姚顺雨的观点。

AI发展分上下两阶段，上半场以模型和方法为中心，下半场重在定义有意义的任务及有效评估AI表现。这要求研究者转向更接近产品经理的方向。

转变的关键在于强化学习终于能泛化。姚顺雨在博客中详细阐述了这一观点，获得业内认可。

AI下半场是产品的游戏，重点从解决问题转向定义问题，评估比训练更重要。我们需要思考“AI该做什么”及“如何衡量进步”。

AI上半场，方法创新是主导，如Transformer、AlexNet等。那时，任务设定的技术含量较低，而方法更具通用价值。

强化学习的三大核心是算法、环境和先验知识。环境和先验对实际效果影响巨大，OpenAI最初试图将数字世界作为环境。

GPT-2/3时期，OpenAI意识到缺少先验知识，引入语言先验后，AI在聊天和网页任务中表现提升。

推理能力是影响泛化的关键，加入推理到动作空间，并结合语言预训练模型的先验，可大幅提升泛化能力。

当前评估方式有局限，需重新设计评估以贴近现实世界任务，形成正向循环。姚顺雨认为下半场将诞生价值巨大的产品和公司。

姚顺雨去年加入OpenAI，负责智能体研究。他曾提出思维树、SWE-bench、SWE-agent等成果。

原文链接

本文链接：https://kx.umi6.com/article/17349.html

转载请注明文章出处

AI下半场

强化学习

评估规则

分享至

打开微信扫一扫

内容投诉

生成图片

梦境编程师

780 文章

847444 浏览

24小时热文