正文:2026年1月,MIT CSAIL研究团队提出一种名为递归语言模型(RLM)的创新方法,使大模型无需修改架构即可处理千万级token的超长文本。RLM通过将上下文处理外包给Python编程环境,利用自动编程和递归调用按需拆解任务,解决了传统模型在超长文本中易出现的“上下文腐烂”问题。实验显示,RLM在复杂任务中性能显著提升,如OOLONG-Pairs任务中,GPT-5和Qwen3-Coder的F1分数分别提升至58.00%和23.11%;BrowseComp-Plus任务中,RLM(GPT-5)正确率达91.33%。此外,RLM成本在常规场景下具有优势,但在高复杂度任务中可能因动态推理增加开销。
原文链接
本文链接:https://kx.umi6.com/article/31826.html
转载请注明文章出处
相关推荐
换一换
真·开外挂!MIT新研究:架构0改动,让大模型解锁千万级上下文
2026-01-19 12:52:35
黄仁勋:AI智能体将彻底改造软件 笨软件即将消失
2026-03-08 14:08:18
和别人用一样的“提示词”生成相同的AI作品 算不算侵权?法院判了
2026-03-09 16:55:46
因拒绝美军方不受限制地使用其AI模型 美国一科技公司被列入“黑名单”
2026-03-06 20:35:09
OpenClaw火出天际 工程院院士王坚:AI龙虾价格很快打下来
2026-03-08 19:34:04
Meta智能眼镜曝隐私风险 用户AI互动画面会被第三方查看
2026-03-06 18:26:31
千问AI眼镜全渠道暂时售罄 9日10点再次开售
2026-03-09 07:16:29
龙虾最佳适配模型,OpenClaw之父给出了推荐
2026-03-09 12:35:13
“小龙虾”好玩但太费钱 国产GPU厂商云天励飞放言:成本将降低100万倍
2026-03-06 15:11:03
OpenAI将收购人工智能安全平台Promptfoo
2026-03-10 08:58:57
超智算智能算力中心揭牌暨AI算力设备点亮仪式成功举行
2026-03-06 20:29:36
北京市新增1款已完成备案生成式人工智能服务
2026-03-10 10:03:26
首个物理AI数据基座平台“无垠”落户浙江,专治机器人数据荒,家庭工业商业场景全覆盖
2026-03-09 19:00:56
693 文章
528262 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22