1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:GPT-4o解验证码成功率仅40%?MetaAgentX发布Open CaptchaWorld平台

MetaAgentX团队推出Open CaptchaWorld,首个专注多模态Agent解验证码能力的研究平台。实测显示,人类解题成功率为93.3%,而顶级多模态模型平均成功率仅5%-40%。GPT-4o等知名模型在验证码前表现不佳,难以应对真实交互环境。

验证码是多模态Agent部署的关键障碍,在电商、登录等高价值场景中普遍存在。然而,现有评估基准多忽略验证码环节,导致模型能力评估失真。Open CaptchaWorld包含20种现代验证码,总计225个样例,涵盖点击、滑块、图像选择等任务,真实模拟网页交互。平台创新性提出CAPTCHA Reasoning Depth指标,量化任务复杂度,弥补传统静态评估的不足。

研究发现,多数先进Agent在验证码面前“过度思考”,成功率低且操作效率不高。例如,“序列点击”任务中,人类快速完成,而模型需分解为十余步操作,增加错误率。此外,平台对比多个模型的成本-性能关系,揭示不同模型在解题成功率和资源消耗间的权衡。

Open CaptchaWorld为Agent开发者提供全新评估视角,强调动态交互与规划能力的重要性,同时推动新型验证码设计以适应技术发展。平台论文已发布于arXiv,代码与数据开源。

— 完 —

原文链接
本文链接:https://kx.umi6.com/article/19710.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
折磨人类的验证码 已经拦不住人机了
2025-10-06 00:27:48
你的验证码又升级了:虐完人类不过瘾,现在要收拾AI 了
2025-07-04 11:39:54
国家网络安全通报中心预警通报关于利用人工智能技术绕过图形类验证机制新型犯罪手法
2025-01-17 17:25:54
腾讯把12亿用户,都变成了免费的“标注民工”
2024-08-15 11:40:18
GPT-4o连验证码都解不了??SOTA模型成功率仅40%
2025-06-04 17:27:46
剪映前AI产品负责人创业多模态Agent,做懂上下文的007乙方,成立半月融资数百万美元
2025-10-29 12:50:06
强如Operator也怕验证码,1450元花得值吗?第一波实测来了
2025-01-25 13:58:28
端侧AI更安心!天玑9500强大双NPU:实现智能体验与隐私安全兼得
2025-12-08 11:25:48
Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死
2025-12-06 21:51:03
微软终于听劝一次!Windows 11右键菜单AI操作可彻底移除
2025-12-08 12:28:38
马斯克谈每年发射100万吨AI卫星:大规模运行AI最低成本方式
2025-12-08 10:20:50
英国拟全面推广 AI 人脸识别系统,但黑人、亚裔“极易”被误报为涉案人员
2025-12-06 16:38:53
广西“十五五”规划建议:积极发展股权、债券等直接融资 支持上市公司提质
2025-12-07 10:25:53
24小时热文
更多
扫一扫体验小程序