1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月14日,一项新研究显示,人类读取指针式时钟的准确率达89.1%,而顶尖AI模型仅13.3%。研究采用名为ClockBench的测试,包含180个定制时钟和720道题目,涵盖时间读取、计算及调整等任务。谷歌Gemini 2.5 Pro以13.3%准确率居首,GPT-5为8.4%,Grok 4垫底仅0.7%。研究指出,AI在视觉推理和特殊钟面设计上存在显著短板,尤其面对罗马数字或彩色背景时准确率更低。此外,尽管AI能完成后续数学运算,但初始视觉信息提取仍是瓶颈。研究者认为,当前AI能力需全新技术突破,而非简单扩大规模。该基准测试被定位为长期工具,完整数据集暂未公开。

原文链接
本文链接:https://kx.umi6.com/article/25203.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
人类VS AI:波兰程序员10小时编程马拉松中击败OpenAI!
2025-07-20 19:08:20
理想同学接入 DeepSeek-R1-0528 最新模型
2025-06-12 19:38:31
Meta 砸 143 亿美元投资 Scale AI 仅数月,双方合作关系出现裂痕
2025-08-31 10:00:15
快手可灵 2.5 Turbo 模型上线,较上代模型便宜近 30%
2025-09-23 20:22:21
OpenAI 发布 AI 打工人报告:前沿模型完成专家级任务,速度快 100 倍,成本仅 1%
2025-09-27 09:38:47
人类秒懂,AI崩溃:一个简单测试,就让GPT-5、Gemini等顶级模型集体“翻车”
2025-09-10 13:34:35
挑战英伟达:首个纯 AMD 硬件训练的 AI 大模型 ZAYA1 登场
2025-11-25 15:56:23
Nature刊文称“AI可模拟人类心智”,Science同日强烈质疑
2025-07-21 09:14:02
美国法官裁定:Meta用书训练AI模型属“合理使用”范畴
2025-06-26 21:02:38
谷歌新App来了!手机没网也能玩AI 还能画图、写代码
2025-06-02 08:30:14
谷歌发布 Gemini 2.5 Computer Use 模型:专攻浏览器交互,支持 13 种操作
2025-10-09 09:08:03
国际象棋最强 AI 鸣锣开赛:首日战果公布,OpenAI 的 o3、xAI 的 Grok4 等晋级
2025-08-06 10:27:23
远超摩尔定律!AI模型每7个月能力翻倍 美国智库:或瓦解民主制度
2025-07-06 16:15:29
24小时热文
更多
扫一扫体验小程序