2026年1月,英伟达联合Astera研究所、斯坦福大学等推出开源大模型记忆压缩方案TTT-E2E。该方法基于动态学习路径,通过实时压缩上下文信息到模型权重中,避免额外缓存需求,在128K上下文处理速度上比全注意力模型快2.7倍,2M上下文提速35倍且性能无损。其核心是将长文本建模转化为持续学习任务,采用元学习优化训练与测试的端到端对齐,并设计三项关键优化(迷你批处理+滑动窗口、精准更新策略、双MLP设计)。实验显示,TTT-E2E在3B参数模型中的表现优于同类模型,推理延迟恒定,适合高效处理超长文本。不过,其在细节召回任务中表现稍逊,且元学习训练较慢。目前代码与论文已开源,项目负责人Stanford博士后Yu Sun主导开发。
原文链接
本文链接:https://kx.umi6.com/article/31613.html
转载请注明文章出处
相关推荐
换一换
英伟达CFO反驳“AI泡沫论”:新增算力不断叠加 全球经济正处于向AI所需的数据中心基础设施转型的“早期阶段”
2025-12-03 11:15:51
中国黄仁勋来自美国英伟达
2026-01-08 20:36:00
AI芯片竞赛升级!Meta据悉转向谷歌TPU 英伟达“王位”不稳?
2025-11-25 17:01:10
谷歌憋了十年的大招,让英伟达好日子到头了?
2025-12-08 12:25:18
6100亿美元AI骗局,假的?
2025-11-24 09:47:14
被英伟达“成绩单”亮瞎眼?华尔街抢着上调目标价,最高达320美元!
2025-11-21 12:19:49
英伟达发布Alpamayo汽车大模型平台 黄仁勋:这是机器理解现实世界的转折点
2026-01-06 07:51:27
良心老黄不搞硅谷资本家那套!Groq人均套现500万美元
2025-12-29 15:28:09
英伟达腹地遭ASIC猛攻!算力芯片格局生变 哪些国产厂商有望迎机遇?
2025-11-26 14:48:51
Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能较 HGX 200 提升 10 倍
2025-12-04 12:20:54
美股开盘涨跌不一 英伟达跌超4%
2025-11-25 23:13:08
英伟达推出适用于自动驾驶汽车和机器人的全新AI工具
2026-01-06 07:52:34
花旗:维持英伟达“买入”评级 当前估值具有吸引力
2026-01-08 15:18:31
698 文章
459187 浏览
24小时热文
更多
-
2026-01-14 16:47:01 -
2026-01-14 16:44:56 -
2026-01-14 16:44:03