1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

《科创板日报》11日讯,今日凌晨,OpenAI正式开源了名为BrowseComp的智能体浏览器功能测试基准。该测试基准具有较高难度,即使是OpenAI自家最先进的模型,如GPT-4o和GPT-4.5,其准确率也仅为0.6%和0.9%,而搭载浏览器功能的GPT-4o准确率也仅提升至1.9%。然而,OpenAI新推出的Agent模型Deep Research表现亮眼,在自主搜索、信息整合及准确性校准等方面表现出色,准确率高达51.5%。此开源项目的推出为研究者提供了重要工具,有助于推动Agent技术的发展。

原文链接
本文链接:https://kx.umi6.com/article/17002.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 前瞻 ChatGPT 终极形态:迈步“App Store”时代,搭积木式创建 AI 智能体
2025-10-07 07:46:59
OpenAI 的网络浏览器:ChatGPT Atlas 正式发布,能让 AI“替你上网”
2025-10-22 02:34:53
OpenAI预告了AI时代“Windows系统”的诞生
2025-10-14 15:21:03
OpenAI 推出网页浏览器 Atlas 后,谷歌股价一度下跌 3%
2025-10-22 11:45:19
黄仁勋回应AMD「送股」OpenAI
2025-10-11 09:32:20
鸿海科技台股大涨8% 董事长刘扬伟会晤OpenAI并计划对话英伟达
2025-10-16 13:55:20
OpenAI 今年推出 GPT - 6?员工否认
2025-10-19 07:43:54
AI最大赢家!研究预测:OpenAI将独揽AI市场1/4收入
2025-10-15 18:42:47
飙涨23.7%,芯片巨头终于等来“泼天机遇”
2025-10-09 09:13:48
Salesforce与OpenAI在企业工作与商业领域建立合作伙伴关系
2025-10-14 21:24:31
OpenAI宣布推出基于ChatGPT技术构建的新型AI网页浏览器ChatGPT Atlas
2025-10-22 03:35:06
沃尔玛宣布与 OpenAI 合作,可在 ChatGPT 聊天中直接购物
2025-10-15 08:29:49
OpenAI 放宽 ChatGPT 成人内容引争议,奥尔特曼回应称“我们不是世界道德警察”
2025-10-16 10:51:00
24小时热文
更多
扫一扫体验小程序