近日,一篇由Ilya Sutskever合著的论文《一步步来验证》在网络上引起了广泛关注。该论文在AI领域被认为仅次于“Attention is all you need”的第二著名论文。Ilya作为OpenAI o1背后的关键人物,其在通用复杂推理领域的贡献尤为突出。o1旨在通过构建思维链,增强模型推理能力,从而实现从记忆答案到记忆推理的范式转变。 论文聚焦于提高大语言模型多步推理能力的方法,对比了结果监督与过程监督两种训练奖励模型的方式。研究发现,过程监督在训练奖励模型上的效果显著优于结果监督,能够训练出更可靠且准确的奖励模型。实验表明,使用过程监督训练的模型在解决MATH数据集中的问题时,正确率高达78.2%,远超结果监督模型及多数投票基线。 在o1背后,包括Ilya在内的多名OpenAI科学家与研究员共同贡献,形成了庞大的研究团队。其中,Jason Wei、Shengjia Zhao、任泓宇等清北校友在大模型研究领域发挥着重要作用,尤其是任泓宇作为GPT-4o和GPT-4o mini的核心贡献者及领导者,致力于提升模型思考速度、深度与敏锐度。 奥特曼在接受采访时强调,AI的发展不应仅局限于学术竞赛,而应更多地关注其在科学研究、材料发现、疾病治疗等实际应用领域的作用。他认为,未来几年,智慧和能源将成为两大基本商品,代表着AI发展的方向。同时,他表示,大模型的进展并未减缓,相反,已经掌握着未来几年的主动权。
原文链接
本文链接:https://kx.umi6.com/article/6410.html
转载请注明文章出处
相关推荐
.png)
换一换
创业仅11周,只有10名员工,Ilya的新公司估值超350亿
2024-09-05 12:05:20
腾讯控股:第二季度在AI领域持续投入并从中获益
2025-08-13 17:43:16
“编程作为一个职业在今日终结”,OpenAI新模型o1的可怕之处
2024-09-15 13:08:47
OpenAI o1开辟“慢思考”,国产AI早已集结在CoE“组团”先出发
2024-09-19 15:33:35
揭秘Ilya新公司:背靠5吨GPU,做核能级安全
2024-06-20 22:37:44
一文看懂OpenAI最强模型o1:怎么用好,为何翻车?
2024-09-20 18:22:13
OpenAI最强模型o1,仍分不出“9.11和9.8哪个大”
2024-09-13 12:16:49
DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版
2025-01-20 22:24:20
Hinton揭秘Ilya成长历程:Scaling Law是他学生时代就有的直觉
2024-05-27 10:09:54
OpenAI o1 非 GPT-4o 直接进化,在成本与性能上妥协
2024-09-16 01:48:17
号称博士生水准!OpenAI最新模型仍分不出9.11和9.8哪个大
2024-09-15 18:12:45
Ilya的新创业伙伴,是个技术加强版的Sam Altman?
2024-06-21 12:40:42
离开OpenAI 后,Ilya 拿了10亿美金对抗AI 作恶
2024-09-06 20:39:46
534 文章
184787 浏览
24小时热文
更多

-
2025-09-07 16:47:03
-
2025-09-07 15:46:08
-
2025-09-07 14:45:54