OpenAI已推出其首款具备“推理”能力的AI模型——o1,旨在加速回答复杂问题的速度并模拟人类思考模式。此模型的问世标志着AI通用复杂推理进入新篇章。o1不仅拥有一个小型、成本较低的版本o1-mini,而且针对编写代码和解决多步骤问题展现出更优性能。然而,其使用成本相对较高,每百万输入词元费用为15美元,输出词元费用为60美元,较GPT-4o分别提高了2倍和3倍。 o1的训练采用了全新的优化算法和定制化的训练数据集,以及强化学习技术,通过奖励和惩罚教导系统自行解决问题。同时,引入了“思维链”概念,使模型能够逐步推理并解释其决策过程。据OpenAI首席研究官Bob McGrew透露,o1在AP数学考试中的表现超越了他本人,甚至在国际数学奥林匹克竞赛的资格考试中,正确解答了83%的问题,显示出其在特定领域的强大能力。 尽管在世界事实知识和网络浏览能力方面仍逊色于GPT-4o,但o1的创新训练方法和独特功能使其成为AI领域的重要里程碑。OpenAI表示,随着后续更新,o1有望在物理、化学和生物学等挑战性领域达到与博士生相当的表现。随着o1和o1-mini的陆续开放,AI的通用复杂推理能力将得到进一步提升,开启人工智能技术的新篇章。
原文链接
本文链接:https://kx.umi6.com/article/6258.html
转载请注明文章出处
相关推荐
换一换
谷歌 DeepMind 优化 AI 模型新思路,计算效率与推理能力兼得
2024-12-28 10:24:13
OpenAI o1模型“我思故我在”,是怎么做到的?
2024-09-18 20:38:45
搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking
2025-01-21 11:36:22
第一个国产中文o1来了,直接数学竞赛题伺候!
2024-11-27 16:56:40
国产AI搜索接入DeepSeek-R1!我们深度试玩了一下
2025-02-03 10:06:40
用“草莓”对抗幻觉?OpenAI新项目隐含人工智能升级关键线索
2024-07-13 12:30:05
截胡 OpenAI:谷歌率先公测“奥数金牌级”推理 AI 模型 Gemini 3 Deep Think
2025-12-05 14:33:37
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
2024-09-13 04:04:10
黄仁勋自曝每天使用ChatGPT!相信它会越来越强
2024-10-11 12:06:04
AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%
2025-05-24 13:07:09
谷歌最强模型 Gemini 2.5 Pro 发布即屠榜,创下史上最大分数飞跃纪录
2025-03-26 07:38:39
Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具
2024-11-18 10:17:27
OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级
2024-07-13 11:59:40
581 文章
342470 浏览
24小时热文
更多
-
2025-12-08 22:52:38 -
2025-12-08 22:51:57 -
2025-12-08 22:51:33