1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

北京时间9月13日,中信证券发布研报,揭示了OpenAI o1模型的重大升级,重点在于思维链与强化学习的融合,显著提升了模型在代码、数学、科学等逻辑密集型领域的推理性能。该模型通过将任务分解为多个简单任务,构建思维链并优化路径,从而提升最终答案的逻辑性和准确性。当前预览版已向部分高级API用户开放,计划下周优先向企业和学术界用户推出。 OpenAI o1模型在编程、数学、科学领域展现出超越专业水准的能力。在Codeforces竞赛中,其算法表现优于83%的专业选手;在数学领域,面对2024年美国数学邀请赛的题库,一次生成的解答正确率为74%,多次尝试后提高至83%,而GPT-4仅能解决12%的问题。在科学领域,GPQA Dimond测试集中,o1模型的正确率为78%,显著领先于人类专家的70%水平。 在技术层面,模型采用强化学习与语言模型(LLM)相结合的方式,通过优化各节点行为寻求最优路径,奖励模型则决定优化方向。该技术在特定领域表现出色,但如何准确评估其他输出结果仍是未来发展的关键挑战。 模型升级带来的算力需求激增,训练和推理阶段的算力投入显著增加,有望推动算力产业链的持续繁荣。在应用端,o1模型的应用将大幅降低开发成本,加速代码、数学、科学等领域的发展。未来,模型通过泛化奖励模型,将有望拓展至更多行业和场景,形成更强大的代理能力,服务于企业汇总、分析、预警、预测、管理等强逻辑任务需求。 尽管存在AI核心技术发展滞后、不当使用引发的社会影响、企业数据安全与信息安全风险、以及行业竞争加剧等潜在风险,但中信证券认为,OpenAI o1模型的推出为AI行业带来了新的发展机遇。建议投资者持续关注这一领域的头部企业,把握市场动向。

原文链接
本文链接:https://kx.umi6.com/article/6417.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
突破多模态奖励瓶颈!中科院清华快手联合提出R1-Reward,用强化学习赋予模型长期推理能力
2025-05-08 18:33:15
受 DeepSeek-R1 启发,小米大模型团队登顶音频推理 MMAU 榜
2025-03-17 12:37:44
稚晖君机器人“葡萄缝针”神技再现江湖 这次是人形的
2025-03-11 23:55:21
24小时热文
更多
扫一扫体验小程序