《科创板日报》11日讯,今日凌晨,OpenAI正式开源了名为BrowseComp的智能体浏览器功能测试基准。该测试基准具有较高难度,即使是OpenAI自家最先进的模型,如GPT-4o和GPT-4.5,其准确率也仅为0.6%和0.9%,而搭载浏览器功能的GPT-4o准确率也仅提升至1.9%。然而,OpenAI新推出的Agent模型Deep Research表现亮眼,在自主搜索、信息整合及准确性校准等方面表现出色,准确率高达51.5%。此开源项目的推出为研究者提供了重要工具,有助于推动Agent技术的发展。
原文链接
本文链接:https://kx.umi6.com/article/17002.html
转载请注明文章出处
相关推荐
换一换
知道你一切隐私的AI 现在着急卖广告赚钱了
2026-02-13 23:46:20
OpenAI 上市前夕管理层大地震!COO转岗 两位高管休假
2026-04-04 17:01:37
没博士没论文,这些人杀进AI大厂
2026-01-27 03:49:22
OpenAI:关于芯片供应 公司已做到“对未来需求心中有数”
2026-02-20 07:10:46
又一个谷歌不作恶式的形象崩塌 OpenAI删除AI安全造福人类承诺
2026-02-14 22:47:09
OpenAI缩减ChatGPT内置购物功能规划
2026-03-05 10:06:59
Ilya曝光70页OpenAI绝密文件
2026-04-07 10:47:37
OpenAI下调算力支出目标至6000亿美元 推进新一轮巨额融资
2026-02-21 09:21:56
OpenAI关停Sora真实原因曝光:烧钱无底洞 用户留不住
2026-03-31 18:00:04
OpenAI宣布以7300亿美元的估值获得1100亿美元新投资
2026-02-27 22:17:29
OpenAI、谷歌员工以公开信反对五角大楼“技术收编”
2026-02-27 20:09:52
OpenAI:GPT-5.2/Codex模型的速度现已提升40%
2026-02-04 13:45:40
黄仁勋否认对OpenAI不满 透露将巨额投资
2026-02-01 19:56:16
678 文章
562740 浏览
24小时热文
更多
-
2026-04-24 23:43:31 -
2026-04-24 23:42:26 -
2026-04-24 23:41:21