《科创板日报》11日讯,今日凌晨,OpenAI正式开源了名为BrowseComp的智能体浏览器功能测试基准。该测试基准具有较高难度,即使是OpenAI自家最先进的模型,如GPT-4o和GPT-4.5,其准确率也仅为0.6%和0.9%,而搭载浏览器功能的GPT-4o准确率也仅提升至1.9%。然而,OpenAI新推出的Agent模型Deep Research表现亮眼,在自主搜索、信息整合及准确性校准等方面表现出色,准确率高达51.5%。此开源项目的推出为研究者提供了重要工具,有助于推动Agent技术的发展。
原文链接
本文链接:https://kx.umi6.com/article/17002.html
转载请注明文章出处
相关推荐
.png)
换一换
GPT-5,要来了?
2025-08-07 11:48:14
OpenAI筹划万亿级AI基建 Altman希望设计新型融资工具
2025-08-16 05:22:34
OpenAI杀入招聘市场:打造AI技能认证体系+人才对接平台
2025-09-05 06:12:15
OpenAI今年预计通过ChatGPT实现近100亿美元收入,机构称GPT-5将给硬件和应用端这些企业带来机遇
2025-09-06 16:37:17
OpenAI今年预计通过ChatGPT实现近100亿美元收入
2025-09-06 10:33:35
GPT-5来了,人人免费可用
2025-08-08 08:08:39
估值达 5000 亿美元,消息称 OpenAI 就股份出售进行谈判
2025-08-06 10:27:16
GPT-5来了
2025-08-08 08:09:56
消息称奥尔特曼淡出 OpenAI 日常管理,聚焦“搞钱”和脑机接口
2025-08-23 07:57:25
OpenAI,向所有反对者“举刀”
2025-09-05 19:23:16
OpenAI称将加强模型识别和应对情绪困扰的能力
2025-09-02 20:44:04
OpenAI发布开源模型“王者归来”,DeepSeek剧情会反转吗
2025-08-06 12:31:08
硅谷“抢人”大战中OpenAI先乱了?人事主管突然离职 据传也被“挖角”
2025-08-22 14:53:01
481 文章
186747 浏览
24小时热文
更多

-
2025-09-08 08:59:49
-
2025-09-08 08:58:43
-
2025-09-08 08:57:36