标题:Nature:OpenAI的Deep Research对科学家有多大用处?
继谷歌发布Gemini Deep Research后,OpenAI推出了类似产品“Deep Research”。该工具能综合数百网站信息,生成详细的引文报告,帮助科学家高效完成文献综述或论文写作。尽管不少科学家对其表现印象深刻,但也有人认为还需改进。
OpenAI将此视作迈向复杂任务AI智能体的重要一步。Deep Research结合了大语言模型的推理能力和互联网搜索能力,优于谷歌的Gemini 1.5 Pro。化学家Andrew White认为,OpenAI的产品在精确性和复杂性方面更胜一筹。免疫学家Derya Unutmaz则表示,这类AI工具撰写综述的水平堪比甚至超越人类。
尽管如此,基于大语言模型的产品仍可能存在不准确或误导性问题。OpenAI承认其产品尚处于早期阶段,存在局限性。Mario Krenn强调,AI目前尚未具备科学家长期深入研究的能力。
在测试中,Deep Research在多项基准测试中表现出色。例如,在Humanity's Last Exam测试中,它以26.6%的成绩位列第一。OpenAI还针对GAIA基准测试,Deep Research获得了58.03%的高分。然而,这类基准测试可能更适合简短问题,而非长篇内容。此外,这些工具无法访问付费信息,这限制了其应用范围。
原文链接
本文链接:https://kx.umi6.com/article/13030.html
转载请注明文章出处
相关推荐
.png)
换一换
Meta 深化与 Arm 战略合作,AI 排名和推荐系统将使用 Neoverse IP 芯片
2025-10-16 09:49:47
万亿对决:苹果vs英伟达
2025-08-29 14:41:02
毕马威:AI已经渗透到药物研发的各个环节
2025-10-15 18:45:41
高德地图:你用AI骗了我两次
2025-09-16 22:20:43
AI动力十足!阿里云超预期增长 收入大涨26%创三年新高
2025-08-29 18:42:25
美图靠AI半年赚了4亿 创始人:真正的对手不是大厂是初创
2025-08-19 11:58:38
2025科技股IPO:Figma的逆袭与不成熟的AI故事
2025-07-16 17:06:58
CoreWeave:算力时代,手握「金铲铲」
2025-10-11 09:31:07
iPhone大卖,给不了苹果安全感
2025-08-03 11:36:33
Figma敲钟:90后辍学少年,如何站上AI资本塔尖?
2025-08-05 09:10:17
混乱、内耗、丑闻:Meta考虑向Google、OpenAI低头
2025-08-31 15:02:37
腾讯高管解读 Q2 财报:会继续加大 AI 投资
2025-08-13 23:43:40
苹果遭遇AI危机,供应商在逃离“果链”中进退两难
2025-07-21 18:21:33
512 文章
245812 浏览
24小时热文
更多

-
2025-10-24 05:23:38
-
2025-10-24 03:21:23
-
2025-10-24 01:20:07