标题:Nature:OpenAI的Deep Research对科学家有多大用处?
继谷歌发布Gemini Deep Research后,OpenAI推出了类似产品“Deep Research”。该工具能综合数百网站信息,生成详细的引文报告,帮助科学家高效完成文献综述或论文写作。尽管不少科学家对其表现印象深刻,但也有人认为还需改进。
OpenAI将此视作迈向复杂任务AI智能体的重要一步。Deep Research结合了大语言模型的推理能力和互联网搜索能力,优于谷歌的Gemini 1.5 Pro。化学家Andrew White认为,OpenAI的产品在精确性和复杂性方面更胜一筹。免疫学家Derya Unutmaz则表示,这类AI工具撰写综述的水平堪比甚至超越人类。
尽管如此,基于大语言模型的产品仍可能存在不准确或误导性问题。OpenAI承认其产品尚处于早期阶段,存在局限性。Mario Krenn强调,AI目前尚未具备科学家长期深入研究的能力。
在测试中,Deep Research在多项基准测试中表现出色。例如,在Humanity's Last Exam测试中,它以26.6%的成绩位列第一。OpenAI还针对GAIA基准测试,Deep Research获得了58.03%的高分。然而,这类基准测试可能更适合简短问题,而非长篇内容。此外,这些工具无法访问付费信息,这限制了其应用范围。
原文链接
本文链接:https://kx.umi6.com/article/13030.html
转载请注明文章出处
相关推荐
.png)
换一换
大模型抢滩高考志愿填报,能否顶替「张雪峰」们?
2025-07-02 13:06:37
NVIDIA CEO黄仁勋奔波中美两国!为了AI 为了造福全人类
2025-07-15 14:45:42
马斯克背叛理想
2025-08-24 22:18:31
谷歌:AI未引起搜索引擎流量下滑
2025-08-07 14:52:28
「软件已死,AI当立」?
2025-08-19 18:03:47
社交平台 X 剖析社区注释:提高事实核查效率同时,存扩散错误信息风险
2025-07-03 09:16:23
高盛:AI 已开始重塑劳动力市场,美国年轻科技从业者首当其冲
2025-08-06 08:24:15
腾讯副总裁蔡学忠:看好 AI 的长期价值,内部 30% 代码由人工智能在写
2025-07-27 11:54:05
千余名作家联名呼吁出版商承诺限制使用 AI:不发行 AI 书籍、不用 AI 配音
2025-06-29 12:29:51
AI带动需求爆发 A股产业链上下游公司“喜报”连连
2025-09-01 07:12:06
未来5-10年,一个不可避免的大趋势
2025-06-26 20:02:13
把枯燥的工作先扔给大模型?
2025-08-15 12:12:45
2025科技股IPO:Figma的逆袭与不成熟的AI故事
2025-07-16 17:06:58
466 文章
167557 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25