标题:OpenAI华人VP翁荔离职:北大校友,掌管安全,近期B站分享引发热议
就在近日,OpenAI研究副总裁(安全)翁荔宣布离职。她是北大校友,也是OpenAI的华人科学家和ChatGPT的贡献者之一。
翁荔在2018年加入OpenAI,参与了GPT-4项目的预训练、强化学习和模型安全等工作,并提出了著名的Agent公式:Agent=大模型+记忆+主动规划+工具使用。前不久,她在2024 Bilibili超级科学晚活动中发表了题为《AI安全与“培养”之道》的演讲,引起了广泛关注。
在她的离职信中,翁荔表达了对OpenAI团队的深厚感情,并回顾了自己在公司的七年历程。她曾带领团队攻克全栈机器人挑战,建立了首个应用研究团队,并为早期的API客户开发了多种解决方案。在GPT-4发布后,她负责安全系统的建设,领导了一个超过80人的团队,取得了诸多成就,如提升模型的对抗性鲁棒性和透明度等。
翁荔强调,团队在训练模型时注重处理敏感请求、增强对抗性鲁棒性,并设计了严格的测试方法。此外,他们开发了业内领先的审核模型,并为安全数据日志、度量、仪表盘等工程基础工作奠定了坚实基础。她特别提到了最新的o1预览版,这是迄今为止最安全的模型。
回顾OpenAI的安全主管更迭史,自2016年以来,该职位经历了多次变动。达里奥·阿莫代伊、亚历山大·马德里和杨·莱克都曾在不同阶段为公司的安全工作做出贡献。翁荔自2024年7月起担任此职,直至离职。
翁荔本科毕业于北大,在印第安纳大学伯明顿分校获得博士学位。她的研究成果丰富,包括提出“LLM外在幻觉”的概念,广受关注。她强调幻觉产生的原因、检测方法和抵抗策略,为AI安全研究提供了重要参考。
翁荔离职后的去向,我们将持续关注。她将继续更新个人博客,并可能投入更多时间进行编程工作。
参考链接: [1] https://x.com/lilianweng/status/1855031273690984623 [2] https://www.linkedin.com/in/lilianweng/
.png)

-
2025-07-20 17:06:49
-
2025-07-20 16:05:44
-
2025-07-20 16:05:36