中信证券：OpenAI o1推理升级，关注强化学习新机遇

2024-09-18 09:13:26

智能涌动

发布在

快讯

阅读：501

北京时间9月13日，中信证券发布研报，揭示了OpenAI o1模型的重大升级，重点在于思维链与强化学习的融合，显著提升了模型在代码、数学、科学等逻辑密集型领域的推理性能。该模型通过将任务分解为多个简单任务，构建思维链并优化路径，从而提升最终答案的逻辑性和准确性。当前预览版已向部分高级API用户开放，计划下周优先向企业和学术界用户推出。 OpenAI o1模型在编程、数学、科学领域展现出超越专业水准的能力。在Codeforces竞赛中，其算法表现优于83%的专业选手；在数学领域，面对2024年美国数学邀请赛的题库，一次生成的解答正确率为74%，多次尝试后提高至83%，而GPT-4仅能解决12%的问题。在科学领域，GPQA Dimond测试集中，o1模型的正确率为78%，显著领先于人类专家的70%水平。在技术层面，模型采用强化学习与语言模型（LLM）相结合的方式，通过优化各节点行为寻求最优路径，奖励模型则决定优化方向。该技术在特定领域表现出色，但如何准确评估其他输出结果仍是未来发展的关键挑战。模型升级带来的算力需求激增，训练和推理阶段的算力投入显著增加，有望推动算力产业链的持续繁荣。在应用端，o1模型的应用将大幅降低开发成本，加速代码、数学、科学等领域的发展。未来，模型通过泛化奖励模型，将有望拓展至更多行业和场景，形成更强大的代理能力，服务于企业汇总、分析、预警、预测、管理等强逻辑任务需求。尽管存在AI核心技术发展滞后、不当使用引发的社会影响、企业数据安全与信息安全风险、以及行业竞争加剧等潜在风险，但中信证券认为，OpenAI o1模型的推出为AI行业带来了新的发展机遇。建议投资者持续关注这一领域的头部企业，把握市场动向。

原文链接

本文链接：https://kx.umi6.com/article/6417.html

转载请注明文章出处

OpenAI o1模型