标题:MIT新研究:在测试时训练,模型推理能力最高提升5.8倍
MIT的研究表明,在测试时对大模型进行训练,可以显著提升其推理能力。在超难的ARC任务中,这种“测试时训练”(Test-Time Training, TTT)方法使模型准确率最高提升至5.83倍,甚至超越了GPT-4和Claude的表现。
不同于传统的训练模式,TTT方法在推理时利用测试样本本身的信息进行快速训练,以调整模型参数。整个过程包括三个关键阶段:数据生成、模型适应范式设计以及推理策略。
数据生成通过构造新的训练任务和数据增强来扩大TTT训练数据集。模型适应范式采用参数高效的LoRA技术,通过低秩矩阵调节预训练模型的权重。在推理阶段,应用数据增强和集成学习策略,提升模型性能。
研究团队以8B参数的GPT-3为基础模型进行测试,结果显示,使用TTT方法后,模型准确率从18.3%提升至47.1%,增长率达到157%。此外,TTT方法对1B模型的提升更为显著,准确率接近调整前的6倍。结合其他方法,TTT还能超过人类的平均水平。
这项研究还提到,此前已有团队利用相同技术在ARC挑战中获得58%的正确率。斯坦福大学华人学者Sun也在研究TTT方法,并取得了一系列重要成果。
原文链接
本文链接:https://kx.umi6.com/article/8607.html
转载请注明文章出处
相关推荐
换一换
o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍
2024-11-12 16:08:07
2026年,品牌该认真对待AI GEO了
2026-01-21 08:55:55
2025年我国人工智能核心产业规模预计突破1.2万亿元
2026-01-21 11:03:25
中国商业联合会:人工智能加速拓展服务消费新场景
2026-01-20 22:36:00
智谱:暂时限量发售GLM Coding Plan
2026-01-21 14:13:51
阶跃星辰开源 10B 多模态模型 Step3-VL-10B,性能媲美千亿级大模型
2026-01-20 19:24:31
2026开年最该来的AI神仙局,就在崇礼太舞小镇
2026-01-21 15:13:07
MiniMax把自家“实习生”放出来了!
2026-01-20 22:31:42
xAI工程师播客聊太嗨,马斯克解雇了他
2026-01-21 18:20:58
OpenAI 回应 ChatGPT 出现广告:平台 95% 是免费用户,会坚守一些原则
2026-01-21 13:13:21
中国互联网大厂的AI时代船票争夺战已经开始了
2026-01-21 00:39:26
恒者蓬勃!第18届创业邦年会暨创业邦100未来独角兽大会圆满举办
2026-01-21 16:16:19
投资界24h | SK海力士发巨额年终奖,人均64万;Kimi正敲定新一轮融资;上海浦东打造百亿国资运营平台
2026-01-21 12:03:45
643 文章
409979 浏览
24小时热文
更多
-
2026-01-21 22:27:36 -
2026-01-21 20:31:18 -
2026-01-21 20:30:12