1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:超越GPT-4o!开源科研神器登场,4500万篇论文检索增强生成可靠答案

由华盛顿大学和艾伦人工智能研究所(Ai2)开发的最新模型OpenScholar,能在几秒内检索4500万篇论文,比GPT-4o更可靠。它是首个从论文到数据集、模型检查点全面开源的科研助手模型。

在20位专家进行的500次对比实验中,72%的情况下他们认为OpenScholar的输出结果超越了人类。它还附带参考文献列表,方便用户查阅。

OpenScholar的功能丰富,能回答关于研究课题的现状、寻找最新数据集、解答论文的技术细节,甚至解释算法如ReLU算法等。多位网友使用后表示,它能快速搜集复杂课题所需的资料,堪称科研神器。

OpenScholar-8B系统的核心组件包括: 1. 开放学者数据存储:包含超过4500万篇论文和2.5亿段落嵌入。 2. 专业检索器和重排序器:用于识别相关段落。 3. 8B参数语言模型:针对科学文献综合任务优化,基于Llama 3.1 8B训练和微调。 4. 迭代自我反馈生成:在推理过程中通过自然语言反馈精炼模型输出。

为评估OpenScholar,团队开发了ScholarQABench基准,涵盖七个数据集。实验显示,OpenScholar在多个维度上优于GPT-4o和Llama 3.1 70B,且搜索结果可靠性更高,不会引用不存在的论文。

与GPT-4o相比,OpenScholar的运营成本低100倍,更适合小型机构和资金不足的实验室。尽管如此,OpenScholar仍存在一些局限,如可能引用不具代表性的论文、生成无参考文献支持的响应或带有幻觉的结果,且受限于付费墙。

团队计划未来纳入更多论文、升级检索算法,并深入整合各领域的经典研究问题和论文。目前,OpenScholar已在多个方面成为表现最佳的AI学术研究助理之一。

访问链接:
Demo: https://openscholar.allen.ai/
论文: https://openscholar.allen.ai/paper
OpenScholar代码: https://github.com/AkariAsai/OpenScholar
ScholarQABench数据集代码: https://github.com/AkariAsai/ScholarQABench
更多测试代码: https://github.com/AkariAsai/OpenScholar_ExpertEval

参考链接:
[1] https://venturebeat.com/ai/openscholar-the-open-source-a-i-thats-outperforming-gpt-4o-in-scientific-research/
[2] https://allenai.org/blog/openscholar

原文链接
本文链接:https://kx.umi6.com/article/9523.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
蚂蚁灵波开源具身大模型LingBot-VLA,让机器人“看的更清楚 做的更明白”
2026-01-28 11:08:15
这么哇塞的世界模型,竟然是开源的!
2026-01-29 17:29:59
腾讯混元图像3.0图生图开源,LMArena跻身全球第一梯队,开源最强
2026-01-28 17:26:24
京东云开源JoyAgent智能体
2025-07-26 10:36:52
美国《连线》杂志:再见,GPT5;你好,千问!
2025-12-29 15:27:00
腾讯智能体框架 Youtu-Agent 开源,搭建 Agent 只需两步
2025-09-02 16:34:48
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
马斯克背叛理想
2025-08-24 22:18:31
英伟达开源Newton引擎与GR00T N1.6模型
2025-09-30 08:28:35
大模型套壳往事
2025-07-14 18:26:03
24小时热文
更多
扫一扫体验小程序