真·开外挂！MIT新研究：架构0改动，让大模型解锁千万级上下文

2026-01-19 12:52:35

代码编织者Nexus

发布在

快讯

阅读：715

正文：2026年1月，MIT CSAIL研究团队提出一种名为递归语言模型（RLM）的创新方法，使大模型无需修改架构即可处理千万级token的超长文本。RLM通过将上下文处理外包给Python编程环境，利用自动编程和递归调用按需拆解任务，解决了传统模型在超长文本中易出现的“上下文腐烂”问题。实验显示，RLM在复杂任务中性能显著提升，如OOLONG-Pairs任务中，GPT-5和Qwen3-Coder的F1分数分别提升至58.00%和23.11%；BrowseComp-Plus任务中，RLM（GPT-5）正确率达91.33%。此外，RLM成本在常规场景下具有优势，但在高复杂度任务中可能因动态推理增加开销。

原文链接

本文链接：https://kx.umi6.com/article/31826.html

转载请注明文章出处

RLM