标题:ChatGPT后训练方法被OpenAI离职联创公开,PPT全网转~
正文: 离开OpenAI后,两位前联合创始人John Schulman和Barret Zoph公开了ChatGPT后训练方法的PPT。John Schulman曾是OpenAI后训练共同负责人,Barret Zoph也曾担任后训练研究VP。
John Schulman在推特上表示,他们在斯坦福做了一场关于后训练及ChatGPT经验的演讲,但未被录制。他们希望通过网络找到演讲录音或视频。
有网友证实,演讲质量很高。有人希望了解更多关于训练后阶段的进展,如推理模型、DeepSeek RL等。
PPT中介绍了后训练阶段的目标和具体步骤,包括监督微调(SFT)、奖励模型(RM)训练和强化学习(RL)。此外,还回顾了ChatGPT的发展历程,展示了模型功能的演变。
John Schulman和Barret Zoph还讨论了在功能扩展和公司规模增长的背景下如何整合变化,包括通过主线模型设置来降低风险。他们提到了一些挑战,如模型生成文本时的拼写错误和过度拒绝问题,并提出了解决方案。
他们还探讨了模型偏见、虚假内容生成等问题,以及如何获取高质量人类反馈。最后,他们推荐了一些关于后训练的论文和博客。
John Schulman和Barret Zoph离开OpenAI后,加入了OpenAI前CTO Mira Murati的新创业项目Thinking Machines Lab。
原文链接
本文链接:https://kx.umi6.com/article/13744.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI将在在阿根廷投资250亿美元,打造拉美首个“星际之门”项目
2025-10-15 06:27:23
OpenAI有花不完的钱?AI泡沫让人想起了当年的网络股
2025-10-15 08:31:01
120 亿年收入撬动 1 万亿美元订单:OpenAI 烧钱搞 AI 基建,奥尔特曼称短期内不优先考虑盈利
2025-10-09 09:09:35
OpenAI已砸1万亿美元 苏姿丰否认AI泡沫化:别太狭隘
2025-10-09 09:20:15
OpenAI号称有花不完的钱!AI泡沫似曾相识 发人深思
2025-10-15 13:34:31
日本政府要求 OpenAI 不得通过 Sora 2 等实施任何可能侵犯版权的行为
2025-10-13 08:54:25
OpenAI首个AI浏览器发布,能改变上网的方式吗?
2025-10-22 08:42:28
存储巨头狂欢持续!与OpenAI达成合作后 三星、SK海力士股价飙升
2025-10-02 11:10:25
OpenAI下订博通10GW定制芯片 AI巨头放言“这才是九牛一毛”
2025-10-14 08:11:43
OpenAl为何“情迷”变现
2025-10-19 12:48:56
OpenAI自研芯片来了,秘密研发18月,AI参与设计,明年部署,目标又是10GW
2025-10-14 11:20:04
OpenAI推出小型语音模型GPT-5 Pro
2025-10-07 03:44:27
OpenAI 硬刚马斯克诉讼:我们不需要也不想要任何商业机密,会保护员工不被吓倒
2025-10-03 08:34:17
564 文章
262058 浏览
24小时热文
更多

-
2025-10-24 01:20:07
-
2025-10-24 00:18:56
-
2025-10-23 21:15:29