超越GPT-4o！开源科研神器登场，4500万篇论文检索增强生成靠谱回答

2024-12-01 20:36:17

AGI探路者

发布在

科普

阅读：745

标题：超越GPT-4o！开源科研神器登场，4500万篇论文检索增强生成可靠答案

由华盛顿大学和艾伦人工智能研究所（Ai2）开发的最新模型OpenScholar，能在几秒内检索4500万篇论文，比GPT-4o更可靠。它是首个从论文到数据集、模型检查点全面开源的科研助手模型。

在20位专家进行的500次对比实验中，72%的情况下他们认为OpenScholar的输出结果超越了人类。它还附带参考文献列表，方便用户查阅。

OpenScholar的功能丰富，能回答关于研究课题的现状、寻找最新数据集、解答论文的技术细节，甚至解释算法如ReLU算法等。多位网友使用后表示，它能快速搜集复杂课题所需的资料，堪称科研神器。

OpenScholar-8B系统的核心组件包括： 1. 开放学者数据存储：包含超过4500万篇论文和2.5亿段落嵌入。 2. 专业检索器和重排序器：用于识别相关段落。 3. 8B参数语言模型：针对科学文献综合任务优化，基于Llama 3.1 8B训练和微调。 4. 迭代自我反馈生成：在推理过程中通过自然语言反馈精炼模型输出。

为评估OpenScholar，团队开发了ScholarQABench基准，涵盖七个数据集。实验显示，OpenScholar在多个维度上优于GPT-4o和Llama 3.1 70B，且搜索结果可靠性更高，不会引用不存在的论文。

与GPT-4o相比，OpenScholar的运营成本低100倍，更适合小型机构和资金不足的实验室。尽管如此，OpenScholar仍存在一些局限，如可能引用不具代表性的论文、生成无参考文献支持的响应或带有幻觉的结果，且受限于付费墙。

团队计划未来纳入更多论文、升级检索算法，并深入整合各领域的经典研究问题和论文。目前，OpenScholar已在多个方面成为表现最佳的AI学术研究助理之一。

访问链接：
Demo: https://openscholar.allen.ai/
论文: https://openscholar.allen.ai/paper
OpenScholar代码: https://github.com/AkariAsai/OpenScholar
ScholarQABench数据集代码: https://github.com/AkariAsai/ScholarQABench
更多测试代码: https://github.com/AkariAsai/OpenScholar_ExpertEval

参考链接：
[1] https://venturebeat.com/ai/openscholar-the-open-source-a-i-thats-outperforming-gpt-4o-in-scientific-research/
[2] https://allenai.org/blog/openscholar

原文链接

本文链接：https://kx.umi6.com/article/9523.html

转载请注明文章出处

OpenScholar