1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:OpenAI的“看图思考”,被玩坏了……

知道大模型开始卷视觉推理了,但没想到这么卷——连数学试卷都快不够用了。

推理分逻辑和演绎两类,GPT-o3更新后两者都有涉及。视觉推理不新鲜,各家都在做,关键是从图片中识别并理解元素,进而应用于交互和任务解决。

Gemini 2.5曾表现出色,但o3刚发布时认不出武康大楼,下午才恢复正常。它能识别验证码,实用性较强,但在传统搜索引擎面前,这类简单任务意义不大。

测试中,o3尝试了国家公务员考试图形推理题,耗时超六分钟,思维链长达5千字,结合代码辅助,可惜答错了。这种归纳推理可用于AI检测AI生成的图像。

o3还能解迷宫,但推理时间长且效果一般,最后生成的路径无法点击。它通过调用外部工具解决问题,但准确率和响应速度有待提高。

演绎推理更令人兴奋,团队设计了“看工位猜MBTI”的挑战。o3通过分析桌面细节,判断同事的性格倾向,虽有趣但有时不如本人了解自己。

总体而言,o3的图片推理能力潜力巨大,但娱乐性强于实用性,切勿用于严肃场合。

原文链接
本文链接:https://kx.umi6.com/article/17410.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI领域“强强联手”:OpenAI与富士康达成合作,在美生产新兴硬件!
2025-11-21 10:14:21
耗电量将相当于整个印度,OpenAI 计划 2033 年前建成 250 吉瓦 AI 数据中心
2025-11-14 17:07:23
OpenAI 推出购物研究工具,ChatGPT 变身更懂你的 AI 购物小助手
2025-11-25 09:44:49
百度新设两个大模型研发部:直接向CEO李彦宏汇报!
2025-11-25 22:10:22
AI 行业再现“闭环交易”:OpenAI 以资源换 Thrive Holdings 股权
2025-12-02 07:59:24
Nano Banana,OpenAI你学不会
2025-11-24 17:05:42
孙正义再次清仓英伟达!上一次教训“价值2500亿美元”
2025-11-12 17:13:01
Intel首席技术、AI官突然跳槽OpenAI!印度裔天才
2025-11-11 12:06:42
Intuit 与 OpenAI 达成 1 亿美元合作,让 ChatGPT 算退税、管财务
2025-11-18 22:41:13
软银将向OpenAI的数据中心工厂投资至多30亿美元
2025-11-20 22:48:15
OpenAI 正式上线 ChatGPT 群聊:最高支持 20 人,AI 也能参与头脑风暴
2025-11-21 09:09:27
业界风向标变了?OpenAI被票选为“最有可能失败初创公司”第二名!
2025-11-18 11:15:52
OpenAI最快将于下周二发布GPT-5.2
2025-12-06 07:18:55
24小时热文
更多
扫一扫体验小程序