
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
《科创板日报》11日讯,今日凌晨,OpenAI正式开源了名为BrowseComp的智能体浏览器功能测试基准。该测试基准具有较高难度,即使是OpenAI自家最先进的模型,如GPT-4o和GPT-4.5,其准确率也仅为0.6%和0.9%,而搭载浏览器功能的GPT-4o准确率也仅提升至1.9%。然而,OpenAI新推出的Agent模型Deep Research表现亮眼,在自主搜索、信息整合及准确性校准等方面表现出色,准确率高达51.5%。此开源项目的推出为研究者提供了重要工具,有助于推动Agent技术的发展。
原文链接
2月23日,在上海举办的2025全球开发者先锋大会“共筑金融新生态:AI大模型落地应用与实践”分论坛上,财跃星辰CTO白祚发表演讲,介绍了“AI小财神”这款面向C端金融领域的财富助手,提供AI数据挖掘、对话及财报解读等功能。相比同类产品,它具备深度推理能力和高质量可信语料,能更深入准确地解读市场信息。此外,“AI小财神”近期还将在网页版上线。白祚预测,2025年将是智能体元年,推理模型将快速迭代至Agent模型,并与多模态技术紧密结合,推动智能体应用的快速增长。
原文链接
加载更多

暂无内容