标题:超越GPT-4o!开源科研神器登场,4500万篇论文检索增强生成可靠答案
由华盛顿大学和艾伦人工智能研究所(Ai2)开发的最新模型OpenScholar,能在几秒内检索4500万篇论文,比GPT-4o更可靠。它是首个从论文到数据集、模型检查点全面开源的科研助手模型。
在20位专家进行的500次对比实验中,72%的情况下他们认为OpenScholar的输出结果超越了人类。它还附带参考文献列表,方便用户查阅。
OpenScholar的功能丰富,能回答关于研究课题的现状、寻找最新数据集、解答论文的技术细节,甚至解释算法如ReLU算法等。多位网友使用后表示,它能快速搜集复杂课题所需的资料,堪称科研神器。
OpenScholar-8B系统的核心组件包括: 1. 开放学者数据存储:包含超过4500万篇论文和2.5亿段落嵌入。 2. 专业检索器和重排序器:用于识别相关段落。 3. 8B参数语言模型:针对科学文献综合任务优化,基于Llama 3.1 8B训练和微调。 4. 迭代自我反馈生成:在推理过程中通过自然语言反馈精炼模型输出。
为评估OpenScholar,团队开发了ScholarQABench基准,涵盖七个数据集。实验显示,OpenScholar在多个维度上优于GPT-4o和Llama 3.1 70B,且搜索结果可靠性更高,不会引用不存在的论文。
与GPT-4o相比,OpenScholar的运营成本低100倍,更适合小型机构和资金不足的实验室。尽管如此,OpenScholar仍存在一些局限,如可能引用不具代表性的论文、生成无参考文献支持的响应或带有幻觉的结果,且受限于付费墙。
团队计划未来纳入更多论文、升级检索算法,并深入整合各领域的经典研究问题和论文。目前,OpenScholar已在多个方面成为表现最佳的AI学术研究助理之一。
访问链接:
Demo: https://openscholar.allen.ai/
论文: https://openscholar.allen.ai/paper
OpenScholar代码: https://github.com/AkariAsai/OpenScholar
ScholarQABench数据集代码: https://github.com/AkariAsai/ScholarQABench
更多测试代码: https://github.com/AkariAsai/OpenScholar_ExpertEval
参考链接:
[1] https://venturebeat.com/ai/openscholar-the-open-source-a-i-thats-outperforming-gpt-4o-in-scientific-research/
[2] https://allenai.org/blog/openscholar
-
2025-12-12 16:02:05 -
2025-12-12 16:01:01 -
2025-12-12 15:59:56