《科创板日报》11日讯,今日凌晨,OpenAI正式开源了名为BrowseComp的智能体浏览器功能测试基准。该测试基准具有较高难度,即使是OpenAI自家最先进的模型,如GPT-4o和GPT-4.5,其准确率也仅为0.6%和0.9%,而搭载浏览器功能的GPT-4o准确率也仅提升至1.9%。然而,OpenAI新推出的Agent模型Deep Research表现亮眼,在自主搜索、信息整合及准确性校准等方面表现出色,准确率高达51.5%。此开源项目的推出为研究者提供了重要工具,有助于推动Agent技术的发展。
原文链接
本文链接:https://kx.umi6.com/article/17002.html
转载请注明文章出处
相关推荐
换一换
OpenAI关停Sora真实原因曝光:烧钱无底洞 用户留不住
2026-03-31 18:00:04
马斯克破大防了:私信求和遭拒,怒喷奥特曼Brockman「全美最恶人」
2026-05-06 12:44:44
AWS与OpenAI联合开发“有状态运行时环境” 预计数月内推出
2026-02-28 14:23:02
豪掷200亿美元 OpenAI据称将与芯片新贵Cerebras达成重磅协议
2026-04-17 15:10:16
中信证券:合纵连横PE巨头 OpenAI与Anthropic加速布局企业级AI市场
2026-05-15 08:31:57
Sora之父“跑路”背后的五大真相是什么?
2026-04-30 17:39:21
OpenAI首席营收官:企业业务收入占比超过40%
2026-04-09 07:54:07
OpenAI聘请OpenClaw AI智能体开发者斯坦伯格
2026-03-09 21:13:27
OpenAI连发两起安全事件!奥特曼住宅遭燃烧弹袭击:20岁男子扬言烧总部
2026-04-11 09:55:12
OpenAI芯片核心叛逃Anthropic!就在量产前夜
2026-06-07 20:48:02
奥特曼趁马斯克出差爆猛料:他曾想让子女继承OpenAI
2026-05-13 12:33:09
GPT-5.4发布:OpenAI首个大一统模型,简直是龙虾原生
2026-03-06 09:42:29
OpenAI缩减ChatGPT内置购物功能规划
2026-03-05 10:06:59
706 文章
643983 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41