2024-09-16 02:18:37
微软发布 Windows Agent Arena 基准框架,评估 AI Agents 运行主流 Windows 应用性能
阅读:202
微软于9月14日发布了Windows Agent Arena基准框架,旨在评估生成式AI代理在运行主流Windows应用时的性能。该框架覆盖了包括Microsoft Edge、谷歌Chrome、Visual Studio Code、预装Windows应用以及VLC等在内的多个常用软件。通过采用OSWorld框架,微软构建了涵盖150多项任务的基准测试,这些任务考验了代理在规划、屏幕理解及工具使用等方面的能力。此外,微软研究院开发的多模态代理Navi也在测试中进行了试验,结果显示其平均任务成功率仅为19.5%,远低于人类74.5%的表现。这一成果揭示了AI代理在处理Windows应用时仍存在显著差距。
原文链接
本文链接:https://kx.umi6.com/article/6381.html
转载请注明文章出处
相关推荐
换一换
微软两日蒸发3810亿美元市值 揭示人工智能投资浪潮开始分化
2026-02-02 16:50:28
微软 AI 帮你定制年终高情商话术:写总结、谈加薪、不得罪同事
2025-12-10 09:34:15
英国将与微软合作构建AI伪造内容检测系统
2026-02-05 18:04:20
美科技巨头扎堆布局英国 AI 领域:微软投资 300 亿美元、英伟达等投资 110 亿英镑
2025-09-17 16:34:02
微软CEO爆料:盖茨最初认为对OpenAI的投资就像是烧钱
2025-10-29 18:04:05
微软消费者 AI 业务负责人苏莱曼:要创造“符合人类利益”的超级智能
2025-12-12 03:26:47
英伟达和微软将向投资人工智能初创公司Anthropic合计投资至多150亿美元
2025-11-18 23:46:41
微软与OpenAI签署新协议 后者将额外购买2500亿美元的Azure服务
2025-10-28 22:13:03
微软Office 365将接入Anthropic AI技术 不再依赖OpenAI
2025-09-10 12:36:58
自动截图玩家游戏画面训练AI 微软否认:只是为了识别
2025-10-26 18:22:58
OpenAI拟将与微软分成比例降至8% 获500亿美元额外收入
2025-09-13 11:25:15
微软CEO纳德拉:公司或在一年内重启招聘 前提是现有员工掌握与AI协作技能
2025-11-03 17:32:01
微软打造首个 AI 超级工厂:多座新一代 Fairwater 数据中心构成站点网络
2025-11-13 14:03:47
667 文章
467655 浏览
24小时热文
更多
-
2026-03-10 11:10:02 -
2026-03-10 11:09:29 -
2026-03-10 11:08:54