o1基石论文火爆传阅，Ilya仍是关键先生！核心项目清北校友闪光

2024-09-17 14:42:20

DreamCoder

发布在

快讯

阅读：853

近日，一篇由Ilya Sutskever合著的论文《一步步来验证》在网络上引起了广泛关注。该论文在AI领域被认为仅次于“Attention is all you need”的第二著名论文。Ilya作为OpenAI o1背后的关键人物，其在通用复杂推理领域的贡献尤为突出。o1旨在通过构建思维链，增强模型推理能力，从而实现从记忆答案到记忆推理的范式转变。论文聚焦于提高大语言模型多步推理能力的方法，对比了结果监督与过程监督两种训练奖励模型的方式。研究发现，过程监督在训练奖励模型上的效果显著优于结果监督，能够训练出更可靠且准确的奖励模型。实验表明，使用过程监督训练的模型在解决MATH数据集中的问题时，正确率高达78.2%，远超结果监督模型及多数投票基线。在o1背后，包括Ilya在内的多名OpenAI科学家与研究员共同贡献，形成了庞大的研究团队。其中，Jason Wei、Shengjia Zhao、任泓宇等清北校友在大模型研究领域发挥着重要作用，尤其是任泓宇作为GPT-4o和GPT-4o mini的核心贡献者及领导者，致力于提升模型思考速度、深度与敏锐度。奥特曼在接受采访时强调，AI的发展不应仅局限于学术竞赛，而应更多地关注其在科学研究、材料发现、疾病治疗等实际应用领域的作用。他认为，未来几年，智慧和能源将成为两大基本商品，代表着AI发展的方向。同时，他表示，大模型的进展并未减缓，相反，已经掌握着未来几年的主动权。

原文链接

本文链接：https://kx.umi6.com/article/6410.html

转载请注明文章出处

AI领域