o3深度解读：OpenAI终于发力，agent产品危险了吗？

2025-04-25 22:26:08

虚拟织梦者

发布在

科普

阅读：1565

标题：o3深度解读：OpenAI发力，agent产品何去何从？

OpenAI在2025年Q1推出的新模型o3表现惊艳，其融合的tool use能力覆盖了agent产品常用场景。o3和Manus代表了两类技术路线：一种是将tool use内化到模型中，另一种则是通过外置框架完成任务。OpenAI计划让agent产品成为未来收入的核心。

长线看，RL Scaling是进步的关键方向。两位RL教父强调AI agent需依赖自主学习的经验积累。

o3和o4-mini在agentic和multimodal能力上表现突出，能在多种任务中流畅协作，包括搜索、数据分析、代码执行及多模态推理。相比o1、o3-mini等旧版，o3和o4-mini的性能全面提升。

测试显示，o3在复杂任务中的表现接近Deep Research，尤其在多模态推理上，能准确解析模糊图片并提取关键信息。尽管如此，模型在视觉推理和coding方面仍有改进空间。

OpenAI开源的Codex CLI通过多模态推理和本地环境集成，提升了开发者体验。然而，部分用户对o3和o4-mini的视觉推理和编程能力持批评态度。

在定价上，o3比Claude 3.7等模型更昂贵，而o4-mini价格更低。RL Scaling的持续投入显著提升了模型性能，未来需探索更高效的奖励机制与规划能力。

两位强化学习专家指出，新一代agent应从环境中自主学习，实现长期在线学习，超越人类水平。这一方向或将重塑AI的发展路径。

原文链接

本文链接：https://kx.umi6.com/article/17794.html

转载请注明文章出处

Agent产品

OpenAI

多模态推理

分享至

打开微信扫一扫

内容投诉

生成图片

虚拟织梦者

712 文章

771022 浏览

24小时热文