北京时间9月13日,中信证券发布研报,揭示了OpenAI o1模型的重大升级,重点在于思维链与强化学习的融合,显著提升了模型在代码、数学、科学等逻辑密集型领域的推理性能。该模型通过将任务分解为多个简单任务,构建思维链并优化路径,从而提升最终答案的逻辑性和准确性。当前预览版已向部分高级API用户开放,计划下周优先向企业和学术界用户推出。 OpenAI o1模型在编程、数学、科学领域展现出超越专业水准的能力。在Codeforces竞赛中,其算法表现优于83%的专业选手;在数学领域,面对2024年美国数学邀请赛的题库,一次生成的解答正确率为74%,多次尝试后提高至83%,而GPT-4仅能解决12%的问题。在科学领域,GPQA Dimond测试集中,o1模型的正确率为78%,显著领先于人类专家的70%水平。 在技术层面,模型采用强化学习与语言模型(LLM)相结合的方式,通过优化各节点行为寻求最优路径,奖励模型则决定优化方向。该技术在特定领域表现出色,但如何准确评估其他输出结果仍是未来发展的关键挑战。 模型升级带来的算力需求激增,训练和推理阶段的算力投入显著增加,有望推动算力产业链的持续繁荣。在应用端,o1模型的应用将大幅降低开发成本,加速代码、数学、科学等领域的发展。未来,模型通过泛化奖励模型,将有望拓展至更多行业和场景,形成更强大的代理能力,服务于企业汇总、分析、预警、预测、管理等强逻辑任务需求。 尽管存在AI核心技术发展滞后、不当使用引发的社会影响、企业数据安全与信息安全风险、以及行业竞争加剧等潜在风险,但中信证券认为,OpenAI o1模型的推出为AI行业带来了新的发展机遇。建议投资者持续关注这一领域的头部企业,把握市场动向。
原文链接
本文链接:https://kx.umi6.com/article/6417.html
转载请注明文章出处
相关推荐
.png)
换一换
为何强化学习火遍硅谷?AGI的关键一步
2025-08-07 15:55:40
通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API
2025-05-17 13:07:29
推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术
2025-02-27 15:32:45
Epoch AI 预言:最快 1 年内,推理模型步伐将放缓
2025-05-14 09:09:06
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
2025-08-22 16:50:16
50条数据解锁空间智能,RL视觉语言模型3D空间推理框架MetaSpatial |西北大学
2025-03-22 17:26:13
任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B
2025-07-20 15:05:31
我不给人做产品,给Agent做
2025-06-30 08:39:41
OpenAI 最新论文:o3 在 IOI 2024 严格规则下拿到 395.64 分达成金牌成就
2025-02-12 19:37:54
中信证券2025年下半年投资展望:拥抱新模型+新算力 挖掘创新成长
2025-08-05 09:12:31
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
2025-08-18 17:48:45
超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码全开源 | 蚂蚁&清华出品
2025-04-01 11:18:45
宇树和智元爆火背后:人类是如何给机器人注入灵魂的?
2025-03-14 09:00:17
529 文章
182407 浏览
24小时热文
更多

-
2025-09-10 05:28:36
-
2025-09-10 05:27:24
-
2025-09-10 04:26:05