标题:MIT新研究:在测试时训练,模型推理能力最高提升5.8倍
MIT的研究表明,在测试时对大模型进行训练,可以显著提升其推理能力。在超难的ARC任务中,这种“测试时训练”(Test-Time Training, TTT)方法使模型准确率最高提升至5.83倍,甚至超越了GPT-4和Claude的表现。
不同于传统的训练模式,TTT方法在推理时利用测试样本本身的信息进行快速训练,以调整模型参数。整个过程包括三个关键阶段:数据生成、模型适应范式设计以及推理策略。
数据生成通过构造新的训练任务和数据增强来扩大TTT训练数据集。模型适应范式采用参数高效的LoRA技术,通过低秩矩阵调节预训练模型的权重。在推理阶段,应用数据增强和集成学习策略,提升模型性能。
研究团队以8B参数的GPT-3为基础模型进行测试,结果显示,使用TTT方法后,模型准确率从18.3%提升至47.1%,增长率达到157%。此外,TTT方法对1B模型的提升更为显著,准确率接近调整前的6倍。结合其他方法,TTT还能超过人类的平均水平。
这项研究还提到,此前已有团队利用相同技术在ARC挑战中获得58%的正确率。斯坦福大学华人学者Sun也在研究TTT方法,并取得了一系列重要成果。
原文链接
本文链接:https://kx.umi6.com/article/8607.html
转载请注明文章出处
相关推荐
.png)
换一换
o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍
2024-11-12 16:08:07
百度发布文心大模型 X1.1 深度思考模型,整体表现超越 DeepSeek R1
2025-09-09 13:14:51
Anthropic的版权诉讼案陷入僵局 法官对15亿美元和解协议仍有质疑
2025-09-09 17:19:03
库克挤爆牙膏!5999元iPhone17上高刷,新款耳机能测心率+同传
2025-09-10 05:27:24
AI教父被前女友用AI甩了
2025-09-09 10:10:39
市场监管总局:积极推动老旧电梯等特种设备更新改造以及电动自行车、家电等消费品以旧换新
2025-09-09 21:25:12
ASML 官宣同 Mistral AI 达成战略合作伙伴关系,并向后者投资 13 亿欧元
2025-09-09 14:16:53
最薄iPhone 登场,eSIM 正式落地
2025-09-10 05:28:36
全网都在玩的生图模型,我用它把iPhone17提前发布了
2025-09-09 16:19:55
饭圈女孩,冲在抵制AI第一线
2025-09-09 07:08:35
全球四项第一!优必选自研人形机器人最强大脑Thinker登顶全球
2025-09-09 12:12:13
“AI 教父”辛顿自曝:前女友在分手时曾用 ChatGPT 来指责他
2025-09-08 18:01:47
AI教父自曝被前女友用AI分手 曾用ChatGPT证明他是“卑鄙小人”
2025-09-09 19:20:13
507 文章
178609 浏览
24小时热文
更多

-
2025-09-10 08:33:06
-
2025-09-10 08:32:11
-
2025-09-10 08:30:58