标题:RAG性能提升20%!清华等推出以笔记为中心的深度检索增强生成框架
在大语言模型广泛应用的背景下,如何更高效结合外部知识提升复杂问题的理解与解答能力成为RAG技术的核心挑战。清华大学、中国科学院大学、华南理工大学、东北大学及九星(AI9Stars)联合团队提出全新适应式RAG方法——DeepNote,首次引入“笔记”作为知识载体,实现更深入、更稳定的知识整合,相比基础RAG性能提升20.1%,并在中小参数量模型中表现出强大能力与泛化性。
传统RAG仅支持一次性检索,难以应对多实体或多事实推理需求。多轮检索虽有所改进,但易引入噪声,降低回答质量。自适应RAG虽引入动态决策机制,但仍面临检索-生成耦合过紧与检索策略决策不足的问题。DeepNote以“笔记”为核心,分为三阶段:笔记初始化、基于笔记的适应式检索及基于笔记的答案生成。它通过自主整理结构化知识,确保每轮检索目标明确,最终生成清晰、完整且连贯的答案。
实验显示,DeepNote在HotpotQA、ASQA等五大代表性数据集上全面超越主流RAG方法,尤其在多跳问答和长形式问答中表现优异。团队还构建高质量训练数据集DNAlign并优化模型,进一步提升其性能。DeepNote不仅实现了“信息生长”,还提高了知识密度,支持自适应停止与深度控制,具有高通用性。该方法为复杂任务提供更接近人类的信息整合与推理能力,具有广泛应用前景。论文与开源项目已发布,欢迎交流。
原文链接
本文链接:https://kx.umi6.com/article/18039.html
转载请注明文章出处
相关推荐
换一换
OpenAI o3-pro发布,也许当前的RAG过时了
2025-06-17 18:31:23
让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多项基准SOTA
2025-09-27 13:43:19
腾讯开源通用文本表示模型 Youtu-Embedding,可应用于企业客服、智能问答等场景
2025-10-14 15:19:49
OceanBase开发者大会:详解Data×AI战略,发布首个 RAG 产品
2025-05-17 13:08:37
RAG是AI版的「油电混动汽车」?
2025-10-14 23:23:51
Meta超级智能实验室首篇论文:重新定义RAG
2025-09-08 17:00:44
Gemini 2.5 Pro负责人:最强百万上下文,做好了能解锁很多应用场景
2025-07-01 08:52:17
2024年,百万上下文依然没有杀死RAG
2024-12-23 14:56:59
没有RAG打底,一切都是PPT,RAG作者Douwe Kiela的10个关键教训
2025-07-01 12:22:59
GPT-4o 系列 AI 模型加持,微软 LlamaParse 文档解析能力全面升级
2024-11-28 14:33:00
只改2行代码,RAG效率暴涨30%!可扩展至百亿级数据规模应用
2025-06-21 15:10:22
只是RAG了一下,我看到了AI大模型的态度!
2025-01-27 14:29:34
DeepSeek点燃国产大模型斗志,RAG等核心技术被重估
2025-02-06 15:32:51
740 文章
559547 浏览
24小时热文
更多
-
2026-04-24 19:29:38 -
2026-04-24 18:31:29 -
2026-04-24 18:30:24