2025年10月4日,Thinking Machines发布论文《LoRA Without Regret》,探讨低秩适配(LoRA)在特定条件下媲美全参数微调(FullFT)的性能。研究表明,LoRA在小到中等规模数据集上表现与FullFT相当,但对大批量训练容忍度较低。关键发现包括:LoRA需应用于所有层(尤其是MLP/MoE层),且其学习率通常为FullFT的10倍。此外,在强化学习场景中,即使低秩LoRA也能达到FullFT的效果。研究旨在推动LoRA在定制化场景中的广泛应用,同时深化对机器学习基础问题的理解。更多详情见博客与论文链接。
原文链接
本文链接:https://kx.umi6.com/article/26250.html
转载请注明文章出处
相关推荐
换一换
Thinking Machines曝LoRA终极指南:10倍学习率,媲美全参微调
2025-10-11 09:28:41
Thinking Machines曝LoRA终极指南:10倍学习率,媲美全参微调
2025-10-04 11:58:49
一句话生成任务专属LoRA!Transformer作者创业公司颠覆LLM微调
2025-06-13 18:12:01
微软打包收购OpenAI?就差一点!
2026-01-21 17:19:03
OpenAI已建立人形机器人实验室 启动以来规模扩大四倍多
2026-01-22 21:11:56
商务部等9部门:推动药品零售企业监管向服务型监管、预防型监管、数智化治理转变
2026-01-22 17:04:48
阿联酋人工智能公司G42:未来几年内将数据中心总容量提升至5吉瓦
2026-01-21 17:23:33
凸显新型国际财经媒体优势 界面财联社旗下财跃星辰AI决策系统入选上海开源典型案例
2026-01-22 12:52:54
卢宗青团队新作:人类先验打底,统一动作对齐,通用机器人模型正在落地
2026-01-22 17:03:53
57.1%的人分不清真假!Runway新视频模型太爆炸
2026-01-22 14:56:01
黄仁勋:AI发展将带来大规模基建投资潮 数据中心建设对建筑、技术工人需求上升
2026-01-22 11:53:27
马斯克下场抢人!xAI组建「人才狙击队」,极客版HR年薪168万
2026-01-22 12:51:47
农业农村部:将持续推动人工智能等在农业领域应用
2026-01-22 11:51:14
666 文章
433848 浏览
24小时热文
更多
-
2026-01-23 18:11:40 -
2026-01-23 18:10:36 -
2026-01-23 18:09:30