1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月14日,一项新研究显示,人类读取指针式时钟的准确率达89.1%,而顶尖AI模型仅13.3%。研究采用名为ClockBench的测试,包含180个定制时钟和720道题目,涵盖时间读取、计算及调整等任务。谷歌Gemini 2.5 Pro以13.3%准确率居首,GPT-5为8.4%,Grok 4垫底仅0.7%。研究指出,AI在视觉推理和特殊钟面设计上存在显著短板,尤其面对罗马数字或彩色背景时准确率更低。此外,尽管AI能完成后续数学运算,但初始视觉信息提取仍是瓶颈。研究者认为,当前AI能力需全新技术突破,而非简单扩大规模。该基准测试被定位为长期工具,完整数据集暂未公开。

原文链接
本文链接:https://kx.umi6.com/article/25203.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
这个AI精准模拟人类行为大脑状态,上Nature了
2025-07-15 17:48:52
OpenAI 的“iPhone 时刻”:奥尔特曼称 GPT-5 是全球最佳写作、编程 AI 模型,免费 ChatGPT 用户也能体验
2025-08-08 03:00:19
马斯克xAI新模型上线,通过“50米外洗车店”测试,回答偏好高度贴合老马本人
2026-02-18 16:31:22
华为AI模型运行专利公布
2025-09-05 15:25:04
马斯克的最快AI模型来了
2025-09-16 12:09:37
新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”
2025-11-08 10:35:27
研究称 AI 模型或将形成自己的“生存驱动力”,避免被人类关闭命运
2025-10-27 08:48:45
微软CEO称该公司计划于周五发布新的智能体AI模型
2025-12-11 13:53:32
谷歌最强 AI 模型 Gemini 3 正式登场:发布即登顶 LMArena,号称迄今最智能
2025-11-19 08:02:25
骁龙X2 Elite NPU算力达80 TOPS 遥遥领先AMD/Intel!为何如此之高
2025-10-19 17:51:16
看完最新国产AI写的公众号文章,我慌了!
2025-12-08 21:48:04
马斯克力挺 AMD:在中小型 AI 模型方面相当不错,暗示将降低对英伟达依赖
2025-09-13 16:27:30
AI大佬Karpathy焦虑了:作为程序员,我从未感到如此落后
2025-12-29 15:29:17
24小时热文
更多
扫一扫体验小程序