标题:o3深度解读:OpenAI发力,agent产品何去何从?
OpenAI在2025年Q1推出的新模型o3表现惊艳,其融合的tool use能力覆盖了agent产品常用场景。o3和Manus代表了两类技术路线:一种是将tool use内化到模型中,另一种则是通过外置框架完成任务。OpenAI计划让agent产品成为未来收入的核心。
长线看,RL Scaling是进步的关键方向。两位RL教父强调AI agent需依赖自主学习的经验积累。
o3和o4-mini在agentic和multimodal能力上表现突出,能在多种任务中流畅协作,包括搜索、数据分析、代码执行及多模态推理。相比o1、o3-mini等旧版,o3和o4-mini的性能全面提升。
测试显示,o3在复杂任务中的表现接近Deep Research,尤其在多模态推理上,能准确解析模糊图片并提取关键信息。尽管如此,模型在视觉推理和coding方面仍有改进空间。
OpenAI开源的Codex CLI通过多模态推理和本地环境集成,提升了开发者体验。然而,部分用户对o3和o4-mini的视觉推理和编程能力持批评态度。
在定价上,o3比Claude 3.7等模型更昂贵,而o4-mini价格更低。RL Scaling的持续投入显著提升了模型性能,未来需探索更高效的奖励机制与规划能力。
两位强化学习专家指出,新一代agent应从环境中自主学习,实现长期在线学习,超越人类水平。这一方向或将重塑AI的发展路径。
原文链接
本文链接:https://kx.umi6.com/article/17794.html
转载请注明文章出处
相关推荐
换一换
OpenAI已建立人形机器人实验室 启动以来规模扩大四倍多
2026-01-22 21:11:56
OpenAI 想赢的不是下一次发布会,而是下一代入口
2025-12-19 21:10:33
美国甲骨文公司:不会延迟交付为OpenAI建造的数据中心
2025-12-13 20:07:27
OpenAI:将自行承担“星际之门”项目能源费用
2026-01-21 12:08:12
全球算力产业,正在陪着OpenAI走钢丝
2026-01-22 13:55:20
OpenAI、Anthropic 讨论与生物技术及其他公司的数据交易
2025-12-17 23:08:38
OpenAI从前首席技术官Murati的AI创企挖走三名员工
2026-01-15 16:46:18
OpenAI据称计划以8300亿美元的估值筹资至多1000亿美元 以支持其雄心勃勃的增长计划
2025-12-19 07:34:47
OpenAI 首席财务官:过去三年,公司收入、算力均累计增长约十倍
2026-01-19 16:03:05
OpenAI高薪招聘“应急主管”:AI安全治理压力持续上升
2025-12-30 00:50:46
分析师:2030年前 OpenAI广告年收入有望达250亿美元
2026-01-20 15:14:56
OpenAI据悉今年付费产品计算利润率已提高到70% 高于2024年底的52%
2025-12-22 10:45:11
Sora APP 30天留存率:1%
2025-12-04 19:38:22
610 文章
395186 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44