标题:鄂维南李航领衔打造高级论文搜索Agent,召回率和精准性超谷歌学术等,科研人员狂喜
正文: 中科院院士鄂维南与字节跳动AI实验室总监李航共同研发了一款高级论文搜索Agent,名为PaSa。该系统由两个Agent组成:Crawler(爬虫)和Selector(选择器),能够模仿人类复杂学术搜索行为。
PaSa的亮点在于其高效的搜索能力和精准性。实验显示,PaSa在召回率和精确率等指标上显著优于谷歌学术、Google with GPT-4o、ChatGPT等基线模型。在AutoScholarQuery测试集中,PaSa-7b的召回率比PaSa-GPT-4o高出9.64%;在RealScholarQuery数据集上,PaSa-7b在召回率@20、召回率@50和召回率@100上分别提升了37.78%、39.90%和39.83%。
PaSa的操作简便,只需提供研究主题或描述想法,即可快速搜索并按相关度排序。点击标题卡即可显示论文详情,无需跳转页面,还能打包下载JSON、BIB格式文件。
团队使用Qwen2.5-7b作为基础模型,通过强化学习优化PaSa。PaSa-7b在AutoScholarQuery测试集上表现优异,与最强基线PaSa-GPT-4o相比,召回率提高了9.64%,精度相当。在RealScholarQuery上,PaSa-7b的召回率提升了30.36%,精度提高4.25%。
鄂维南和李航分别是PaSa项目的领军人物。鄂维南是中国科学院院士,“AI for Science”概念的提出者;李航则是字节跳动AI实验室总监,同时也是三大国际顶级学会Fellow。
原文链接
本文链接:https://kx.umi6.com/article/12204.html
转载请注明文章出处
相关推荐
换一换
鄂维南李航领衔造高级论文搜索Agent,召回率和精准性超谷歌学术等,磕盐党狂喜
2025-01-26 17:13:39
夸克推出“学术搜索”,每次 AI 回答可引用超 10 篇文献内容
2024-11-18 14:23:17
亚马逊据悉开发新型AI智能体以自动执行部分部门职能
2026-03-25 08:10:59
中文名确定!Token正式被译名为“词元”:我国日均调用量突破140万亿
2026-03-24 16:01:46
小米集团:2025年智能电动汽车及AI等创新业务分部收入同比增长223.8%
2026-03-24 18:09:46
天玑科技与超聚变达成战略合作 将围绕算力基础设施深度融合等三大方向协同发力
2026-03-25 10:20:03
广东:深入推进“广东强芯”、“璀璨行动”、核心软件攻关等重大科技工程
2026-03-26 10:51:42
腾讯挖来多位字节Seed骨干 直接向姚顺雨汇报
2026-03-24 21:24:57
黄仁勋呼吁所有人使用AI提升自己:大学生毕业时都要成AI专家
2026-03-24 22:28:35
内存焦虑有救了!谷歌发布新型AI内存压缩技术
2026-03-26 11:55:04
广州:重点突破国产化AI算力芯片适配、异构算力动态调度技术 构建自主可控的智算中心架构
2026-03-26 18:16:21
Lumentum计划在美新建InP基光学器件工厂
2026-03-26 22:24:22
中芯国际:预计2026年销售收入增幅高于可比同业的平均值 资本开支与2025年相比大致持平
2026-03-26 19:16:47
680 文章
557702 浏览
24小时热文
更多
-
2026-03-26 22:25:30 -
2026-03-26 22:24:22 -
2026-03-26 20:20:04