
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年9月,Meta超级智能实验室发布首篇论文,提出名为REFRAG的高效解码框架,重新定义了检索增强生成(RAG)。该框架通过“压缩、感知、扩展”三步优化LLM处理外部知识的方式,最高可将首字生成延迟(TTFT)加速30倍,同时保持性能无损。实验显示,REFRAG在推理速度、困惑度及下游任务准确率上表现优异,并将上下文窗口等效扩大16倍。研究基于对RAG计算冗余的观察,提出选择性压缩解码方案,解决了长上下文处理中的效率问题,适用于多轮对话、长文档摘要等任务,为AI应用开发提供了重要解决方案。目前,该研究已在网络引发热议。
原文链接
加载更多

暂无内容