1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

《科创板日报》11日讯,今日凌晨,OpenAI正式开源了名为BrowseComp的智能体浏览器功能测试基准。该测试基准具有较高难度,即使是OpenAI自家最先进的模型,如GPT-4o和GPT-4.5,其准确率也仅为0.6%和0.9%,而搭载浏览器功能的GPT-4o准确率也仅提升至1.9%。然而,OpenAI新推出的Agent模型Deep Research表现亮眼,在自主搜索、信息整合及准确性校准等方面表现出色,准确率高达51.5%。此开源项目的推出为研究者提供了重要工具,有助于推动Agent技术的发展。

原文链接
本文链接:https://kx.umi6.com/article/17002.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-5.4发布:OpenAI首个大一统模型,简直是龙虾原生
2026-03-06 09:42:29
截至上月末 OpenAI年化收入突破250亿美元
2026-03-05 12:14:25
三个和尚没水喝!OpenAI星际之门搁浅,一年过去压根没动工
2026-02-23 15:34:57
OpenAI战略大转舵 全速冲刺ChatGPT商业化
2026-02-03 13:39:40
OpenAI:推出用户年龄预测功能 以保护未成年用户
2026-01-21 15:17:45
OpenAI发布ChatGPT健康 押注万亿AI医疗市场
2026-01-08 16:20:44
OpenAI与Ginkgo合作使蛋白质生产成本降低40%
2026-02-06 03:31:10
OpenAI拟在ChatGPT中测试定向广告加码营收增长计划
2026-01-17 04:09:18
有望挑战传统机翻,OpenAI 低调上线“ChatGPT 翻译”页面
2026-01-15 08:20:52
OpenAI称将ChatGPT引入美国国防部通用人工智能平台
2026-02-10 15:22:03
GPT-5.4意外泄露!OpenAI最新模型瞄准这2大能力突围
2026-03-03 19:25:38
OpenAI ChatGPT 被曝开辟求职新赛道:AI 打磨简历、规划职业路径等
2026-01-10 09:02:04
英伟达据悉接近达成协议在OpenAI最新一轮融资中投资200亿美元
2026-02-04 08:28:18
24小时热文
更多
扫一扫体验小程序