标题:Nature:OpenAI的Deep Research对科学家有多大用处?
继谷歌发布Gemini Deep Research后,OpenAI推出了类似产品“Deep Research”。该工具能综合数百网站信息,生成详细的引文报告,帮助科学家高效完成文献综述或论文写作。尽管不少科学家对其表现印象深刻,但也有人认为还需改进。
OpenAI将此视作迈向复杂任务AI智能体的重要一步。Deep Research结合了大语言模型的推理能力和互联网搜索能力,优于谷歌的Gemini 1.5 Pro。化学家Andrew White认为,OpenAI的产品在精确性和复杂性方面更胜一筹。免疫学家Derya Unutmaz则表示,这类AI工具撰写综述的水平堪比甚至超越人类。
尽管如此,基于大语言模型的产品仍可能存在不准确或误导性问题。OpenAI承认其产品尚处于早期阶段,存在局限性。Mario Krenn强调,AI目前尚未具备科学家长期深入研究的能力。
在测试中,Deep Research在多项基准测试中表现出色。例如,在Humanity's Last Exam测试中,它以26.6%的成绩位列第一。OpenAI还针对GAIA基准测试,Deep Research获得了58.03%的高分。然而,这类基准测试可能更适合简短问题,而非长篇内容。此外,这些工具无法访问付费信息,这限制了其应用范围。
原文链接
本文链接:https://kx.umi6.com/article/13030.html
转载请注明文章出处
相关推荐
换一换
别被制造焦虑了!黄仁勋:AI根本不会让人失业 新工作会越来越多
2026-03-18 18:43:23
调查显示:逾九成德国人担忧AI被用于深度伪造
2026-04-02 16:10:42
AI引爆存储芯片需求!SK海力士将豪掷近130亿美元建设封装厂
2026-01-13 16:46:52
中信建投:预计由AI等带来的光纤需求将持续较快增长
2026-01-29 08:05:48
高盛:AI去年对美国GDP贡献几乎为零
2026-02-24 16:56:59
华为将于3月20日发布数据存储新品
2026-03-10 16:39:18
谷歌狠狠地给苹果「上了一课」
2026-01-15 11:33:56
Anthropic 及谷歌 DeepMind CEO:AI 已开始取代公司内部的初级职位
2026-01-21 09:02:38
HALO交易站上风口 机构掘金A股确定性机会
2026-03-16 07:36:41
SaaS的末日已经来了?
2026-02-07 09:49:00
Token一词该怎么翻译!清华教授提议中文名为模元
2026-03-20 16:48:30
传统软件业,集体跌下斩杀线
2026-02-07 09:53:37
人大代表:年轻人不要和AI比效率 不是一个聪明的选择
2026-03-04 00:49:02
693 文章
593408 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17