标题:OpenAI的“看图思考”,被玩坏了……
知道大模型开始卷视觉推理了,但没想到这么卷——连数学试卷都快不够用了。
推理分逻辑和演绎两类,GPT-o3更新后两者都有涉及。视觉推理不新鲜,各家都在做,关键是从图片中识别并理解元素,进而应用于交互和任务解决。
Gemini 2.5曾表现出色,但o3刚发布时认不出武康大楼,下午才恢复正常。它能识别验证码,实用性较强,但在传统搜索引擎面前,这类简单任务意义不大。
测试中,o3尝试了国家公务员考试图形推理题,耗时超六分钟,思维链长达5千字,结合代码辅助,可惜答错了。这种归纳推理可用于AI检测AI生成的图像。
o3还能解迷宫,但推理时间长且效果一般,最后生成的路径无法点击。它通过调用外部工具解决问题,但准确率和响应速度有待提高。
演绎推理更令人兴奋,团队设计了“看工位猜MBTI”的挑战。o3通过分析桌面细节,判断同事的性格倾向,虽有趣但有时不如本人了解自己。
总体而言,o3的图片推理能力潜力巨大,但娱乐性强于实用性,切勿用于严肃场合。
原文链接
本文链接:https://kx.umi6.com/article/17410.html
转载请注明文章出处
相关推荐
换一换
刚被媒体曝黑料 豪宅又被人爆弹 OpenAI CEO回应:气得要命
2026-04-11 14:03:36
美团内测万亿级新一代大模型,全程基于国产算力集群训练
2026-04-24 12:12:33
刘壮陈丹琦新作:开源通用视觉推理RL框架,0思考数据刷新SOTA
2026-04-11 09:51:56
OpenAI回应TanStack供应链攻击:未发现用户数据泄露
2026-05-14 14:41:58
马斯克破大防了:私信求和遭拒,怒喷奥特曼Brockman「全美最恶人」
2026-05-06 12:44:44
Sora之父“跑路”背后的五大真相是什么?
2026-04-30 17:39:21
OpenAI开创“算力换股权”玩法:奥尔特曼向数百家YC创企发出邀约
2026-05-20 17:49:51
中信证券:合纵连横PE巨头 OpenAI与Anthropic加速布局企业级AI市场
2026-05-15 08:31:57
OpenAI关停Sora 奥尔特曼坦言:为了下一代AI 集中计算资源
2026-04-07 20:16:56
大模型收入暴涨1076%,港股AGI第一股首份年报:一年狂揽12亿,属实把商业化玩明白了
2026-03-27 17:08:13
OpenAI首席营收官:企业业务收入占比超过40%
2026-04-09 07:54:07
OpenAI推动伊利诺伊州先进AI免责立法
2026-04-10 17:22:59
OpenAI急眼了!四页密信怒撕Claude,80亿营收全掺水
2026-04-14 17:09:22
803 文章
717582 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41