1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:超越GPT-4o!开源科研神器登场,4500万篇论文检索增强生成可靠答案

由华盛顿大学和艾伦人工智能研究所(Ai2)开发的最新模型OpenScholar,能在几秒内检索4500万篇论文,比GPT-4o更可靠。它是首个从论文到数据集、模型检查点全面开源的科研助手模型。

在20位专家进行的500次对比实验中,72%的情况下他们认为OpenScholar的输出结果超越了人类。它还附带参考文献列表,方便用户查阅。

OpenScholar的功能丰富,能回答关于研究课题的现状、寻找最新数据集、解答论文的技术细节,甚至解释算法如ReLU算法等。多位网友使用后表示,它能快速搜集复杂课题所需的资料,堪称科研神器。

OpenScholar-8B系统的核心组件包括: 1. 开放学者数据存储:包含超过4500万篇论文和2.5亿段落嵌入。 2. 专业检索器和重排序器:用于识别相关段落。 3. 8B参数语言模型:针对科学文献综合任务优化,基于Llama 3.1 8B训练和微调。 4. 迭代自我反馈生成:在推理过程中通过自然语言反馈精炼模型输出。

为评估OpenScholar,团队开发了ScholarQABench基准,涵盖七个数据集。实验显示,OpenScholar在多个维度上优于GPT-4o和Llama 3.1 70B,且搜索结果可靠性更高,不会引用不存在的论文。

与GPT-4o相比,OpenScholar的运营成本低100倍,更适合小型机构和资金不足的实验室。尽管如此,OpenScholar仍存在一些局限,如可能引用不具代表性的论文、生成无参考文献支持的响应或带有幻觉的结果,且受限于付费墙。

团队计划未来纳入更多论文、升级检索算法,并深入整合各领域的经典研究问题和论文。目前,OpenScholar已在多个方面成为表现最佳的AI学术研究助理之一。

访问链接:
Demo: https://openscholar.allen.ai/
论文: https://openscholar.allen.ai/paper
OpenScholar代码: https://github.com/AkariAsai/OpenScholar
ScholarQABench数据集代码: https://github.com/AkariAsai/ScholarQABench
更多测试代码: https://github.com/AkariAsai/OpenScholar_ExpertEval

参考链接:
[1] https://venturebeat.com/ai/openscholar-the-open-source-a-i-thats-outperforming-gpt-4o-in-scientific-research/
[2] https://allenai.org/blog/openscholar

原文链接
本文链接:https://kx.umi6.com/article/9523.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
马斯克宣布Grok-2正式开源 Grok-3也将在大概6个月内开源
2025-08-24 18:18:35
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
2025-11-11 18:20:16
英伟达开源Newton引擎与GR00T N1.6模型
2025-09-30 08:28:35
Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……
2025-11-04 12:11:12
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
2025-06-06 22:39:37
阿里云创始人王坚:人工智能时代将带来“计算卫星”
2025-09-11 15:59:12
Hugging Face 公布 4.5 亿参数开源机器人模型 SmolVLA,消费级硬件设备即可运行
2025-06-09 18:33:05
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
小米全面开源具身大模型MiMo-Embodied
2025-11-21 21:43:50
京东云开源JoyAgent智能体
2025-07-26 10:36:52
DeepSeek会在全球AI竞争中沉沦吗?
2025-06-03 14:57:13
行业首个 100% 开源的企业级智能体,京东云开源 JoyAgent
2025-07-26 11:37:17
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
24小时热文
更多
扫一扫体验小程序