标题:MIT新研究:在测试时训练,模型推理能力最高提升5.8倍
MIT的研究表明,在测试时对大模型进行训练,可以显著提升其推理能力。在超难的ARC任务中,这种“测试时训练”(Test-Time Training, TTT)方法使模型准确率最高提升至5.83倍,甚至超越了GPT-4和Claude的表现。
不同于传统的训练模式,TTT方法在推理时利用测试样本本身的信息进行快速训练,以调整模型参数。整个过程包括三个关键阶段:数据生成、模型适应范式设计以及推理策略。
数据生成通过构造新的训练任务和数据增强来扩大TTT训练数据集。模型适应范式采用参数高效的LoRA技术,通过低秩矩阵调节预训练模型的权重。在推理阶段,应用数据增强和集成学习策略,提升模型性能。
研究团队以8B参数的GPT-3为基础模型进行测试,结果显示,使用TTT方法后,模型准确率从18.3%提升至47.1%,增长率达到157%。此外,TTT方法对1B模型的提升更为显著,准确率接近调整前的6倍。结合其他方法,TTT还能超过人类的平均水平。
这项研究还提到,此前已有团队利用相同技术在ARC挑战中获得58%的正确率。斯坦福大学华人学者Sun也在研究TTT方法,并取得了一系列重要成果。
原文链接
本文链接:https://kx.umi6.com/article/8607.html
转载请注明文章出处
相关推荐
换一换
o1不是唯一路径!MIT新研究:在测试时训练,模型推理能力最高升至5.8倍
2024-11-12 16:08:07
Sora 2上线之后,我却发现了AIGC的另一种可能性
2025-10-31 11:28:17
张一鸣的AI电商野心,藏不住了
2025-10-31 07:19:24
黄仁勋:AI产业已进入“良性循环”,全球万亿级算力基建才刚起步
2025-10-31 19:49:43
中科曙光即将发布基于AI计算开放架构的超节点产品
2025-10-31 15:39:57
自然语言简化查找专利流程,Perplexity 推出新版 AI 检索工具
2025-10-31 23:56:43
中兴通讯AI攻克芯片检测难题:3秒完成单图检测 效率提升60倍
2025-10-31 15:38:26
英伟达CEO黄仁勋完成10亿美元股票出售
2025-11-01 06:13:22
GitHub 最新预测:到 2030 年印度软件开发者数量将超美国,登顶全球
2025-10-30 15:49:45
天猫双11:消费级AI设备智能眼镜成交同比涨25倍
2025-10-31 18:46:14
存储大厂西部数据公布亮眼财报:AI和云数据需求强劲 拟提高硬盘价格
2025-10-31 09:28:28
AI百科全书SciencePedia:当马斯克Grokipedia遭遇滑铁卢,有个中国团队默默把活儿干了
2025-10-30 23:02:12
谷歌给印度最大运营商 Jio 用户送福利:18 个月的 AI Pro 订阅服务免费送
2025-10-31 08:22:42
559 文章
266492 浏览
24小时热文
更多
-
2025-11-02 09:14:28 -
2025-11-02 08:13:58 -
2025-11-02 00:55:11