标题:o3深度解读:OpenAI发力,agent产品何去何从?
OpenAI在2025年Q1推出的新模型o3表现惊艳,其融合的tool use能力覆盖了agent产品常用场景。o3和Manus代表了两类技术路线:一种是将tool use内化到模型中,另一种则是通过外置框架完成任务。OpenAI计划让agent产品成为未来收入的核心。
长线看,RL Scaling是进步的关键方向。两位RL教父强调AI agent需依赖自主学习的经验积累。
o3和o4-mini在agentic和multimodal能力上表现突出,能在多种任务中流畅协作,包括搜索、数据分析、代码执行及多模态推理。相比o1、o3-mini等旧版,o3和o4-mini的性能全面提升。
测试显示,o3在复杂任务中的表现接近Deep Research,尤其在多模态推理上,能准确解析模糊图片并提取关键信息。尽管如此,模型在视觉推理和coding方面仍有改进空间。
OpenAI开源的Codex CLI通过多模态推理和本地环境集成,提升了开发者体验。然而,部分用户对o3和o4-mini的视觉推理和编程能力持批评态度。
在定价上,o3比Claude 3.7等模型更昂贵,而o4-mini价格更低。RL Scaling的持续投入显著提升了模型性能,未来需探索更高效的奖励机制与规划能力。
两位强化学习专家指出,新一代agent应从环境中自主学习,实现长期在线学习,超越人类水平。这一方向或将重塑AI的发展路径。
原文链接
本文链接:https://kx.umi6.com/article/17794.html
转载请注明文章出处
相关推荐
.png)
换一换
刚刚,OpenAI开源2个推理模型:笔记本/手机就能跑,性能接近o4-mini
2025-08-06 06:22:19
"Stargate" AI 基建下一站:消息称 OpenAI 计划在印度建设 GW 级大型数据中心
2025-09-01 15:19:57
估值升至5000亿美元!OpenAI洽谈出售约60亿美元员工股权
2025-08-16 10:24:15
OpenAI的前世今生
2025-08-27 10:01:51
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
OpenAI被曝向千名员工“撒钱”留人
2025-08-08 17:17:16
OpenAI 重组“模型行为”团队,重点任务是让 ChatGPT“有性格”
2025-09-06 23:39:46
OpenAI 推出两款开源模型 gpt-oss-120b / 20b,性能逼近 o4-mini/o3-mini
2025-08-06 08:23:05
OpenAI 寻求增加收入,高管称不排除在 ChatGPT 内插入广告的可能
2025-08-15 10:11:06
OpenAI向美国政府提供ChatGPT企业版:每个机构每年1美元
2025-08-07 01:41:14
OpenAI,向所有反对者“举刀”
2025-09-05 19:23:16
Anthropic:OpenAI 模型易被“滥用”,GPT 竟能提供炸药配方
2025-08-30 16:52:06
OpenAI 迄今最智能 AI 模型:“六边形战士”GPT-5 登场,准确性、速度、推理能力等全面突破
2025-08-08 01:59:39
476 文章
164429 浏览
24小时热文
更多

-
2025-09-07 00:40:01
-
2025-09-06 23:39:46
-
2025-09-06 22:39:24