1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月14日,一项新研究显示,人类读取指针式时钟的准确率达89.1%,而顶尖AI模型仅13.3%。研究采用名为ClockBench的测试,包含180个定制时钟和720道题目,涵盖时间读取、计算及调整等任务。谷歌Gemini 2.5 Pro以13.3%准确率居首,GPT-5为8.4%,Grok 4垫底仅0.7%。研究指出,AI在视觉推理和特殊钟面设计上存在显著短板,尤其面对罗马数字或彩色背景时准确率更低。此外,尽管AI能完成后续数学运算,但初始视觉信息提取仍是瓶颈。研究者认为,当前AI能力需全新技术突破,而非简单扩大规模。该基准测试被定位为长期工具,完整数据集暂未公开。

原文链接
本文链接:https://kx.umi6.com/article/25203.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI发布新款AI模型o3和o4-mini
2025-04-17 01:18:17
宇树王兴兴:2025 年底,相对比较通用的人形机器人 AI 模型真的有可能诞生
2025-05-02 17:03:29
GPT-5发布了,到底有没有那么神?
2025-08-08 09:10:02
Meta 砸 143 亿美元投资 Scale AI 仅数月,双方合作关系出现裂痕
2025-08-31 10:00:15
OpenAI、Anthropic 互评对方 AI 模型:GPT 存在谄媚行为,Claude 不易产生幻觉
2025-08-28 10:18:59
马斯克的最强 AI 模型 Grok 4 现已免费开放,非订阅用户每天可限量使用
2025-08-11 10:02:03
“老当益壮”:AI 模型成功在 43 年前的 Commodore 64 电脑上运行
2025-05-04 11:01:32
挑战AI数学推理极限!大规模形式化数学基准FormalMATH发布,最强模型成功率仅16%
2025-05-08 09:23:53
OpenAI 董事会主席:如果你想快速烧掉百万美元,就开发自己的 AI 模型吧
2025-07-26 17:44:00
美亿万富翁投资人马克・库班呼吁:在 AI 模型上投放广告应被视作违法行为
2025-07-28 19:18:03
英伟达三大AI重磅产品齐发,GPU服务器性能暴增18倍
2025-08-13 16:37:45
微软发布可在CPU上运行的超高效AI模型BitNet
2025-04-18 10:08:41
用AI把一段视频变成可视化网页,Google的新模型又卷飞了
2025-05-07 11:05:10
24小时热文
更多
扫一扫体验小程序