1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,一篇由Ilya Sutskever合著的论文《一步步来验证》在网络上引起了广泛关注。该论文在AI领域被认为仅次于“Attention is all you need”的第二著名论文。Ilya作为OpenAI o1背后的关键人物,其在通用复杂推理领域的贡献尤为突出。o1旨在通过构建思维链,增强模型推理能力,从而实现从记忆答案到记忆推理的范式转变。 论文聚焦于提高大语言模型多步推理能力的方法,对比了结果监督与过程监督两种训练奖励模型的方式。研究发现,过程监督在训练奖励模型上的效果显著优于结果监督,能够训练出更可靠且准确的奖励模型。实验表明,使用过程监督训练的模型在解决MATH数据集中的问题时,正确率高达78.2%,远超结果监督模型及多数投票基线。 在o1背后,包括Ilya在内的多名OpenAI科学家与研究员共同贡献,形成了庞大的研究团队。其中,Jason Wei、Shengjia Zhao、任泓宇等清北校友在大模型研究领域发挥着重要作用,尤其是任泓宇作为GPT-4o和GPT-4o mini的核心贡献者及领导者,致力于提升模型思考速度、深度与敏锐度。 奥特曼在接受采访时强调,AI的发展不应仅局限于学术竞赛,而应更多地关注其在科学研究、材料发现、疾病治疗等实际应用领域的作用。他认为,未来几年,智慧和能源将成为两大基本商品,代表着AI发展的方向。同时,他表示,大模型的进展并未减缓,相反,已经掌握着未来几年的主动权。

原文链接
本文链接:https://kx.umi6.com/article/6410.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
走出元宇宙阴影的Meta,或成AI领域下一匹黑马
2024-08-12 18:49:17
DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版
2025-01-20 22:24:20
一句废话就把OpenAI o1干崩了?大模型的推理能力还真挺脆弱的
2024-10-15 18:44:31
24小时热文
更多
扫一扫体验小程序