1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

《科创板日报》11日讯,今日凌晨,OpenAI正式开源了名为BrowseComp的智能体浏览器功能测试基准。该测试基准具有较高难度,即使是OpenAI自家最先进的模型,如GPT-4o和GPT-4.5,其准确率也仅为0.6%和0.9%,而搭载浏览器功能的GPT-4o准确率也仅提升至1.9%。然而,OpenAI新推出的Agent模型Deep Research表现亮眼,在自主搜索、信息整合及准确性校准等方面表现出色,准确率高达51.5%。此开源项目的推出为研究者提供了重要工具,有助于推动Agent技术的发展。

原文链接
本文链接:https://kx.umi6.com/article/17002.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
消息称 Anthropic 有望比 OpenAI 更快实现盈利,前者 2028 年就能盈亏平衡
2025-11-11 19:21:58
OpenAI开始变得俗气了
2025-11-15 16:58:14
剑指全球最大订阅服务!OpenAI预计:ChatGPT五年内付费用户将达2.2亿
2025-11-26 14:47:40
Intuit 与 OpenAI 达成 1 亿美元合作,让 ChatGPT 算退税、管财务
2025-11-18 22:41:13
OpenAI首席研究员Mark Chen长访谈:小扎亲手端汤来公司挖人,气得我们端着汤去了Meta
2025-12-03 09:05:55
OpenAI宣布与富士康达成合作
2025-11-21 08:09:03
耗电量将相当于整个印度,OpenAI 计划 2033 年前建成 250 吉瓦 AI 数据中心
2025-11-14 17:07:23
汇丰:预计OpenAI到2030年仍难以盈利
2025-11-27 19:53:15
汇丰银行:OpenAI 到 2030 年都难以盈利,同时还要再砸至少 2070 亿美元
2025-11-27 15:43:07
OpenAI最快将于下周二发布GPT-5.2
2025-12-06 07:18:55
消息称 OpenAI 进军医疗健康领域,探索开发消费级健康工具
2025-11-10 19:27:33
OpenAI与Target携手 将新的AI驱动体验带入零售领域
2025-11-19 19:35:24
OpenAI将收购AI模型训练工具初创公司Neptune
2025-12-04 05:01:41
24小时热文
更多
扫一扫体验小程序