
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年7月,IMO赛场上演AI巅峰对决。7月19日,顶尖大模型几乎全军覆没;两天后,OpenAI和DeepMind等实验室斩获5/6题。7月23日,哈佛与UCLA学生用Gemini 2.5 Pro+多轮验证框架发布论文并开源代码。次日,蚂蚁AWorld团队仅用6小时复现DeepMind成果,开源一键运行的多智能体IMO系统。实验表明,多智能体协同能超越单模能力,解决复杂IMO问题,并提出构建最优输入、实现元认知等理论支持。AWorld采用事件驱动架构,具备模型即插即用、全链路可观测性等优势。团队透露,未来将测试“多智能体+形式化验证”组合,目标直指Lean4形式化证明。IMO或成人类最后一次战胜AI的机会。
原文链接
标题:GPT-4o解验证码成功率仅40%?MetaAgentX发布Open CaptchaWorld平台
MetaAgentX团队推出Open CaptchaWorld,首个专注多模态Agent解验证码能力的研究平台。实测显示,人类解题成功率为93.3%,而顶级多模态模型平均成功率仅5%-40%...
原文链接
加载更多

暂无内容