综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
在2025年,RAG(检索增强生成)技术成为AI应用的热门路径,广泛用于企业知识库问答、智能客服等场景。尽管RAG通过引入外部知识库提升了回答准确性,但它仅是过渡性工具,无法实现真正的理解与推理。文章指出,RAG存在硬边界:它只能“贴答案”而无法理解语义,缺乏上下文穿透能力,且输出常逻辑混乱。作者认为,真正的智能系统应将知识内化为模型的一部分,而非依赖外挂知识库。未来可能的解法包括知识内化微调和多跳推理架构优化。RAG虽解决了部分工程问题,但被过度推崇为“终极方案”,实际只是通往认知智能的临时工具。真正的AI时代仍在前方,未来模型将像人类一样从经验中提取规则,构建知识逻辑体系。
原文链接
2025年10月14日,腾讯优图实验室正式开源通用文本表示模型Youtu-Embedding。该模型专为企业级应用设计,可广泛应用于企业客服、智能问答、内容推荐等场景,尤其适合构建RAG检索增强生成系统。Youtu-Embedding通过深度神经网络将文本映射到高维向量空间,显著提升语义理解能力,在中文文本嵌入评测基准CMTEB中以77.46分位居榜首。其核心优势包括三阶段训练流程、创新的微调框架和精细化的数据工程。模型权重、推理代码及完整训练框架已发布,首个版本含20亿参数,可在HuggingFace和GitHub获取。
原文链接
ACL 2025最新研究提出Lexical Diversity-aware RAG(DRAG)框架,首次将词汇多样性引入RAG的检索与生成过程,在多项基准任务中显著提升性能。该框架通过Diversity-sensitive Relevance Analyzer(DRA)和Risk-guided Sparse Calibration(RSC)两大模块,解决了词汇多样性带来的检索偏差和生成干扰问题。在HotpotQA等多跳问答任务中,准确率提升10.6%,刷新SOTA;在ASQA长答案生成任务中表现同样优异。此方法对信息检索、问答系统及专业领域大模型应用具有重要价值,代码即将开源。
原文链接
2025年9月,Meta超级智能实验室发布首篇论文,提出名为REFRAG的高效解码框架,重新定义了检索增强生成(RAG)。该框架通过“压缩、感知、扩展”三步优化LLM处理外部知识的方式,最高可将首字生成延迟(TTFT)加速30倍,同时保持性能无损。实验显示,REFRAG在推理速度、困惑度及下游任务准确率上表现优异,并将上下文窗口等效扩大16倍。研究基于对RAG计算冗余的观察,提出选择性压缩解码方案,解决了长上下文处理中的效率问题,适用于多轮对话、长文档摘要等任务,为AI应用开发提供了重要解决方案。目前,该研究已在网络引发热议。
原文链接
标题:没有RAG打底,一切都是PPT,RAG作者Douwe Kiela的10个关键教训
AI聊天不够自然、准确率不足是许多企业在应用大模型时遇到的常见问题。这些问题与RAG(检索增强生成)技术密切相关。RAG能提升模型表现,但真正用好的公司不多。Douwe Kiela作为RAG的开创者之一,提出...
原文链接
Gemini 2.5 Pro模型在AI编程实践中,能够直接读取整个项目,带来全新的体验。长上下文能革新产品交互并开启全新应用场景。谷歌DeepMind的Nikolay Savinov指出,当前百万级token上下文质量尚未完美,盲目追求更大规模意义不大;随着成本下降,千万级token上下文将成为标准...
原文链接
标题:只改2行代码,RAG效率暴涨30%!可扩展至百亿级数据规模应用
只需修改两行代码,RAG向量检索效率提升30%,适用于文搜文、图搜图、文搜图及推荐系统召回等多种任务,且具备十亿至百亿级数据的扩展能力。浙江大学高云君、柯翔宇团队与向量检索专家傅聪合作,开源新方法PSP(Proximity g...
原文链接
OpenAI近日发布了o3-pro,号称最强推理AI模型,其推理能力显著提升。同时,OpenAI宣布o3的价格下调80%,使输入和输出token的成本分别降至2美元和8美元每百万,相比调整前大幅降低。这一价格已接近GPT-4o的水平,对开发者更具吸引力。o3-pro具备200k的上下文窗口和100k的最大输出token数,可支持约15万字的提示词输入,极大增强了RAG(检索增强生成)的能力。专家表示,更强的上下文支持和更低的成本将推动RAG技术在复杂应用场景中的进一步发展,包括医疗诊断、知识图谱构建及推理型任务等。尽管如此,模型对长文的理解仍有限,未来可能需要结合更多智能化策略优化性能。
原文链接
标题:OceanBase开发者大会详解Data×AI战略并发布首个RAG产品
升级AI战略后的OceanBase首次举办开发者大会。5月17日,OceanBase在第三届开发者大会上发布面向AI的应用产品PowerRAG,提供开箱即用的RAG应用开发能力,这是其在AI时代的重要探索之一。Ocea...
原文链接
标题:RAG性能提升20%!清华等推出以笔记为中心的深度检索增强生成框架
在大语言模型广泛应用的背景下,如何更高效结合外部知识提升复杂问题的理解与解答能力成为RAG技术的核心挑战。清华大学、中国科学院大学、华南理工大学、东北大学及九星(AI9Stars)联合团队提出全新适应式RAG方法——Dee...
原文链接
加载更多
暂无内容