北京时间9月13日,中信证券发布研报,揭示了OpenAI o1模型的重大升级,重点在于思维链与强化学习的融合,显著提升了模型在代码、数学、科学等逻辑密集型领域的推理性能。该模型通过将任务分解为多个简单任务,构建思维链并优化路径,从而提升最终答案的逻辑性和准确性。当前预览版已向部分高级API用户开放,计划下周优先向企业和学术界用户推出。 OpenAI o1模型在编程、数学、科学领域展现出超越专业水准的能力。在Codeforces竞赛中,其算法表现优于83%的专业选手;在数学领域,面对2024年美国数学邀请赛的题库,一次生成的解答正确率为74%,多次尝试后提高至83%,而GPT-4仅能解决12%的问题。在科学领域,GPQA Dimond测试集中,o1模型的正确率为78%,显著领先于人类专家的70%水平。 在技术层面,模型采用强化学习与语言模型(LLM)相结合的方式,通过优化各节点行为寻求最优路径,奖励模型则决定优化方向。该技术在特定领域表现出色,但如何准确评估其他输出结果仍是未来发展的关键挑战。 模型升级带来的算力需求激增,训练和推理阶段的算力投入显著增加,有望推动算力产业链的持续繁荣。在应用端,o1模型的应用将大幅降低开发成本,加速代码、数学、科学等领域的发展。未来,模型通过泛化奖励模型,将有望拓展至更多行业和场景,形成更强大的代理能力,服务于企业汇总、分析、预警、预测、管理等强逻辑任务需求。 尽管存在AI核心技术发展滞后、不当使用引发的社会影响、企业数据安全与信息安全风险、以及行业竞争加剧等潜在风险,但中信证券认为,OpenAI o1模型的推出为AI行业带来了新的发展机遇。建议投资者持续关注这一领域的头部企业,把握市场动向。
原文链接
本文链接:https://kx.umi6.com/article/6417.html
转载请注明文章出处
相关推荐
换一换
Thinking Machine新研究刷屏!结合RL+微调,小模型训练更具性价比
2025-10-28 10:41:47
中信证券:通信自主可控加速 持续看好国产算力
2025-10-09 09:25:50
性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent
2025-06-23 09:22:20
中信证券:AI应用仍具备较大成长空间
2026-01-20 08:46:50
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
2025-07-01 15:26:33
Claude 4如何思考?资深研究员回应:RLVR已在编程/数学得到验证
2025-05-24 15:19:19
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
2025-09-26 11:24:15
秒级生成百万级token!九章云极发布九章智算云Alaya NeW Cloud 2.0
2025-06-16 19:13:12
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025-11-05 15:09:36
中信证券:AI对计算机板块的增长贡献将进一步提升 看好新一轮行情机遇
2025-09-08 08:59:49
中信证券:海外AI催化密集 看好商业化潜力
2025-10-14 09:14:20
马斯克亲自点名Karpathy迎战Grok 5!别神话LLM,AGI还要等十年
2025-10-20 15:08:42
攻克强化学习「最慢一环」!交大字节联手,RL训练速度飙升2.6倍
2025-09-13 17:30:05
669 文章
443248 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29