RAG - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

RAG是AI版的「油电混动汽车」？

在2025年，RAG（检索增强生成）技术成为AI应用的热门路径，广泛用于企业知识库问答、智能客服等场景。尽管RAG通过引入外部知识库提升了回答准确性，但它仅是过渡性工具，无法实现真正的理解与推理。文章指出，RAG存在硬边界：它只能“贴答案”而无法理解语义，缺乏上下文穿透能力，且输出常逻辑混乱。作者认为，真正的智能系统应将知识内化为模型的一部分，而非依赖外挂知识库。未来可能的解法包括知识内化微调和多跳推理架构优化。RAG虽解决了部分工程问题，但被过度推崇为“终极方案”，实际只是通往认知智能的临时工具。真正的AI时代仍在前方，未来模型将像人类一样从经验中提取规则，构建知识逻辑体系。

原文链接

数字墨迹

10-14 23:23:51

分享至

打开微信扫一扫

内容投诉

生成图片

腾讯开源通用文本表示模型 Youtu-Embedding，可应用于企业客服、智能问答等场景

2025年10月14日，腾讯优图实验室正式开源通用文本表示模型Youtu-Embedding。该模型专为企业级应用设计，可广泛应用于企业客服、智能问答、内容推荐等场景，尤其适合构建RAG检索增强生成系统。Youtu-Embedding通过深度神经网络将文本映射到高维向量空间，显著提升语义理解能力，在中文文本嵌入评测基准CMTEB中以77.46分位居榜首。其核心优势包括三阶段训练流程、创新的微调框架和精细化的数据工程。模型权重、推理代码及完整训练框架已发布，首个版本含20亿参数，可在HuggingFace和GitHub获取。

原文链接

AGI探路者

10-14 15:19:49

分享至

打开微信扫一扫

内容投诉

生成图片

让RAG真正读懂“言外之意”！新框架引入词汇多样性，刷新多项基准SOTA

ACL 2025最新研究提出Lexical Diversity-aware RAG（DRAG）框架，首次将词汇多样性引入RAG的检索与生成过程，在多项基准任务中显著提升性能。该框架通过Diversity-sensitive Relevance Analyzer（DRA）和Risk-guided Sparse Calibration（RSC）两大模块，解决了词汇多样性带来的检索偏差和生成干扰问题。在HotpotQA等多跳问答任务中，准确率提升10.6%，刷新SOTA；在ASQA长答案生成任务中表现同样优异。此方法对信息检索、问答系统及专业领域大模型应用具有重要价值，代码即将开源。

原文链接

Oasis

09-27 13:43:19

分享至

打开微信扫一扫

内容投诉

生成图片

Meta超级智能实验室首篇论文：重新定义RAG

2025年9月，Meta超级智能实验室发布首篇论文，提出名为REFRAG的高效解码框架，重新定义了检索增强生成（RAG）。该框架通过“压缩、感知、扩展”三步优化LLM处理外部知识的方式，最高可将首字生成延迟（TTFT）加速30倍，同时保持性能无损。实验显示，REFRAG在推理速度、困惑度及下游任务准确率上表现优异，并将上下文窗口等效扩大16倍。研究基于对RAG计算冗余的观察，提出选择性压缩解码方案，解决了长上下文处理中的效率问题，适用于多轮对话、长文档摘要等任务，为AI应用开发提供了重要解决方案。目前，该研究已在网络引发热议。

原文链接

未来笔触

09-08 17:00:44

分享至

打开微信扫一扫

内容投诉

生成图片

没有RAG打底，一切都是PPT，RAG作者Douwe Kiela的10个关键教训

标题：没有RAG打底，一切都是PPT，RAG作者Douwe Kiela的10个关键教训 AI聊天不够自然、准确率不足是许多企业在应用大模型时遇到的常见问题。这些问题与RAG（检索增强生成）技术密切相关。RAG能提升模型表现，但真正用好的公司不多。Douwe Kiela作为RAG的开创者之一，提出...

原文链接

WisdomTrail

07-01 12:22:59

分享至

打开微信扫一扫

内容投诉

生成图片

Gemini 2.5 Pro负责人：最强百万上下文，做好了能解锁很多应用场景

Gemini 2.5 Pro模型在AI编程实践中，能够直接读取整个项目，带来全新的体验。长上下文能革新产品交互并开启全新应用场景。谷歌DeepMind的Nikolay Savinov指出，当前百万级token上下文质量尚未完美，盲目追求更大规模意义不大；随着成本下降，千万级token上下文将成为标准...

原文链接

AGI探路者

07-01 08:52:17

分享至

打开微信扫一扫

内容投诉

生成图片

只改2行代码，RAG效率暴涨30%！可扩展至百亿级数据规模应用

标题：只改2行代码，RAG效率暴涨30%！可扩展至百亿级数据规模应用只需修改两行代码，RAG向量检索效率提升30%，适用于文搜文、图搜图、文搜图及推荐系统召回等多种任务，且具备十亿至百亿级数据的扩展能力。浙江大学高云君、柯翔宇团队与向量检索专家傅聪合作，开源新方法PSP（Proximity g...

原文链接

AI创想团

06-21 15:10:22

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o3-pro发布，也许当前的RAG过时了

OpenAI近日发布了o3-pro，号称最强推理AI模型，其推理能力显著提升。同时，OpenAI宣布o3的价格下调80%，使输入和输出token的成本分别降至2美元和8美元每百万，相比调整前大幅降低。这一价格已接近GPT-4o的水平，对开发者更具吸引力。o3-pro具备200k的上下文窗口和100k的最大输出token数，可支持约15万字的提示词输入，极大增强了RAG（检索增强生成）的能力。专家表示，更强的上下文支持和更低的成本将推动RAG技术在复杂应用场景中的进一步发展，包括医疗诊断、知识图谱构建及推理型任务等。尽管如此，模型对长文的理解仍有限，未来可能需要结合更多智能化策略优化性能。

原文链接

镜像现实MirageX

06-17 18:31:23

分享至

打开微信扫一扫

内容投诉

生成图片

OceanBase开发者大会：详解Data×AI战略，发布首个 RAG 产品

标题：OceanBase开发者大会详解Data×AI战略并发布首个RAG产品升级AI战略后的OceanBase首次举办开发者大会。5月17日，OceanBase在第三届开发者大会上发布面向AI的应用产品PowerRAG，提供开箱即用的RAG应用开发能力，这是其在AI时代的重要探索之一。Ocea...

原文链接

未来笔触

05-17 13:08:37

分享至

打开微信扫一扫

内容投诉

生成图片

RAG性能暴增20%！清华等推出以笔记为中心的深度检索增强生成框架

标题：RAG性能提升20%！清华等推出以笔记为中心的深度检索增强生成框架在大语言模型广泛应用的背景下，如何更高效结合外部知识提升复杂问题的理解与解答能力成为RAG技术的核心挑战。清华大学、中国科学院大学、华南理工大学、东北大学及九星（AI9Stars）联合团队提出全新适应式RAG方法——Dee...

原文链接