1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

微软于9月14日发布了Windows Agent Arena基准框架,旨在评估生成式AI代理在运行主流Windows应用时的性能。该框架覆盖了包括Microsoft Edge、谷歌Chrome、Visual Studio Code、预装Windows应用以及VLC等在内的多个常用软件。通过采用OSWorld框架,微软构建了涵盖150多项任务的基准测试,这些任务考验了代理在规划、屏幕理解及工具使用等方面的能力。此外,微软研究院开发的多模态代理Navi也在测试中进行了试验,结果显示其平均任务成功率仅为19.5%,远低于人类74.5%的表现。这一成果揭示了AI代理在处理Windows应用时仍存在显著差距。

原文链接
本文链接:https://kx.umi6.com/article/6381.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI热潮带动业绩股价双升 微软CEO年薪跃升至近7亿
2025-10-22 17:51:04
消息称微软计划全面改革 GitHub,以抗衡 AI 编程工具竞品并布局 AI 智能体领域
2026-01-08 19:25:56
用AI代码替换Windows里每一行C/C++!微软回应了
2025-12-25 22:00:44
微软宣布组建超级智能团队,自研 AI 模型摆脱对 OpenAI 的依赖
2025-11-06 23:18:30
微软、雪佛龙和Engine No.1签署电力供应独家协议
2026-04-01 08:35:31
浮出水面!微软下一代Maia 2芯片或交由英特尔代工
2025-10-20 16:10:19
微软CEO:公司可能重启招聘 前提是现有员工掌握与AI协作的技能
2025-11-03 17:33:07
奥特曼纳德拉同台回应一切:合作细节、OpenAI未来路线曝光
2025-11-02 18:36:32
英伟达和微软将向投资人工智能初创公司Anthropic合计投资至多150亿美元
2025-11-18 23:46:41
微软否认下调 AI 销售指标,增长目标≠销售配额
2025-12-05 10:18:06
微软自研AI芯片遇阻:计划借力OpenAI技术实现突围
2025-11-13 09:52:43
微软独家:OpenAI最新季度净亏损115亿美元
2025-11-01 10:21:05
每秒 110 万个 token!微软联手英伟达刷新 AI 推理纪录
2025-11-05 16:14:31
24小时热文
更多
扫一扫体验小程序