《科创板日报》11日讯,今日凌晨,OpenAI正式开源了名为BrowseComp的智能体浏览器功能测试基准。该测试基准具有较高难度,即使是OpenAI自家最先进的模型,如GPT-4o和GPT-4.5,其准确率也仅为0.6%和0.9%,而搭载浏览器功能的GPT-4o准确率也仅提升至1.9%。然而,OpenAI新推出的Agent模型Deep Research表现亮眼,在自主搜索、信息整合及准确性校准等方面表现出色,准确率高达51.5%。此开源项目的推出为研究者提供了重要工具,有助于推动Agent技术的发展。
原文链接
本文链接:https://kx.umi6.com/article/17002.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI要开发能聊天的AI版Office挑战微软?
2025-07-08 11:43:40
OpenAI最新点名的中国竞争对手:竟不是DeepSeek、而是智谱!
2025-06-30 17:45:07
OpenAI股票薪酬支出飙升至营收的119%
2025-07-08 08:41:26
419 文章
63858 浏览
24小时热文
更多

-
2025-07-20 17:06:49
-
2025-07-20 16:05:44
-
2025-07-20 16:05:36