正文:2026年1月,MIT CSAIL研究团队提出一种名为递归语言模型(RLM)的创新方法,使大模型无需修改架构即可处理千万级token的超长文本。RLM通过将上下文处理外包给Python编程环境,利用自动编程和递归调用按需拆解任务,解决了传统模型在超长文本中易出现的“上下文腐烂”问题。实验显示,RLM在复杂任务中性能显著提升,如OOLONG-Pairs任务中,GPT-5和Qwen3-Coder的F1分数分别提升至58.00%和23.11%;BrowseComp-Plus任务中,RLM(GPT-5)正确率达91.33%。此外,RLM成本在常规场景下具有优势,但在高复杂度任务中可能因动态推理增加开销。
原文链接
本文链接:https://kx.umi6.com/article/31826.html
转载请注明文章出处
相关推荐
换一换
真·开外挂!MIT新研究:架构0改动,让大模型解锁千万级上下文
2026-01-19 12:52:35
三菱:预计到2030年 美国天然气需求比2025年水平增长18%
2026-01-16 15:57:27
我国人工智能企业数量已超6200家
2026-01-16 15:57:37
一人公司,疑云四起
2026-01-17 17:37:27
伦敦市长警告:若放任 AI 失控发展,就业环境恐被大规模摧毁
2026-01-19 08:21:30
打造最低幻觉率医学AI助手 阿里健康上线“氢离子”
2026-01-19 10:49:07
Anthropic拟筹资250亿美元或更多 红杉资本将参与融资
2026-01-18 19:39:42
从致敬活字印刷到打造归元平台 长城汽车以用户价值重构造车基座
2026-01-17 21:48:48
消息称红杉资本等参与 Anthropic 新一轮 250 亿美元融资,估值达 3500 亿美元
2026-01-18 22:47:49
特朗普拟紧急干预电力市场:强压AI巨头签15年长约 为150亿美元新电厂买单
2026-01-16 19:54:18
Cursor 一夜翻车:300 万代码写浏览器被打假,全网群嘲 AI 泔水
2026-01-17 16:37:14
马斯克:用于 Grok 的“Colossus 2”超级计算机已投入运行,全球首个吉瓦级训练集群
2026-01-17 23:52:09
Anthropic 将 Claude Cowork AI 智能体扩展至 20 美元 Pro 订阅用户
2026-01-18 11:14:18
662 文章
464904 浏览
24小时热文
更多
-
2026-01-19 15:01:31 -
2026-01-19 15:00:06 -
2026-01-19 14:56:56