1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:OpenAI的“看图思考”,被玩坏了……

知道大模型开始卷视觉推理了,但没想到这么卷——连数学试卷都快不够用了。

推理分逻辑和演绎两类,GPT-o3更新后两者都有涉及。视觉推理不新鲜,各家都在做,关键是从图片中识别并理解元素,进而应用于交互和任务解决。

Gemini 2.5曾表现出色,但o3刚发布时认不出武康大楼,下午才恢复正常。它能识别验证码,实用性较强,但在传统搜索引擎面前,这类简单任务意义不大。

测试中,o3尝试了国家公务员考试图形推理题,耗时超六分钟,思维链长达5千字,结合代码辅助,可惜答错了。这种归纳推理可用于AI检测AI生成的图像。

o3还能解迷宫,但推理时间长且效果一般,最后生成的路径无法点击。它通过调用外部工具解决问题,但准确率和响应速度有待提高。

演绎推理更令人兴奋,团队设计了“看工位猜MBTI”的挑战。o3通过分析桌面细节,判断同事的性格倾向,虽有趣但有时不如本人了解自己。

总体而言,o3的图片推理能力潜力巨大,但娱乐性强于实用性,切勿用于严肃场合。

原文链接
本文链接:https://kx.umi6.com/article/17410.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI再造爆款?AI视频社交应用Sora问鼎苹果热门App榜单
2025-10-04 00:49:30
再见了ChatGPT,我只想堂堂正正地当个成年人
2025-09-29 12:09:01
DeepSeek首次回应蒸馏OpenAI质疑 :没有故意加入合成数据
2025-09-18 14:54:07
满屏 AI 换脸,OpenAI 新应用 Sora 遭自家研究员吐槽
2025-10-02 11:08:52
OpenAI拟将与微软分成比例降至8% 获500亿美元额外收入
2025-09-13 11:25:15
OpenAI首批智能硬件传出新消息
2025-09-20 09:24:50
OpenAI 硬刚马斯克诉讼:我们不需要也不想要任何商业机密,会保护员工不被吓倒
2025-10-03 08:34:17
你用的大模型是什么MBTI?
2025-09-23 20:23:14
DeepSeek V3.2、GLM4.6等大模型即将发布
2025-09-29 17:14:30
大模型即OS,AI云即计算机:阿里的全栈赌注
2025-09-25 10:00:29
AI股上涨的“永动机”,还能继续吗?
2025-09-30 20:32:32
大模型驱动算力革命 AI芯片迎破局新机遇
2025-09-18 07:47:51
英伟达 CEO 黄仁勋谈错失 OpenAI 早期投资:因当时太穷了未投够
2025-09-29 15:12:02
24小时热文
更多
扫一扫体验小程序