2025年10月11日,Thinking Machines发布论文《LoRA Without Regret》,探讨低秩适配(LoRA)在特定条件下媲美全参数微调(FullFT)的性能。研究表明,当LoRA应用于网络所有层(尤其是MLP/MoE层)且训练参数量充足时,其表现与FullFT相当。实验发现,LoRA的学习率通常是FullFT的10倍,大批量训练下容忍度较低。此外,在强化学习场景中,即使低秩LoRA也能达到FullFT的效果。研究基于Tulu3、OpenThoughts3及MATH等数据集,覆盖监督学习和策略梯度算法。此成果推动LoRA在定制化场景中的应用,同时为机器学习优化提供新视角。
原文链接
本文链接:https://kx.umi6.com/article/26382.html
转载请注明文章出处
相关推荐
.png)
换一换
西工大团队在人工智能驱动绿色合成氨催化剂研究方面取得新进展
2024-06-05 09:28:56
谷歌通过机器学习判断用户年龄:你的搜索行为、观看内容都可作为依据
2025-08-01 09:06:16
AI 可“听”出电池起火征兆,准确率达 94%
2024-11-18 10:19:37
机器学习“元素周期表”创建 二十多种算法促进AI技术发展
2025-04-27 08:07:59
AI大模型可助力孤独症早期筛查
2024-08-22 23:21:44
“最大的障碍来自物理学界”,MIT物理学家反思AI与物理的结合
2025-08-19 09:55:16
新型AI工具有助更精准预测疾病风险
2025-08-28 23:29:54
一句话生成任务专属LoRA!Transformer作者创业公司颠覆LLM微调
2025-06-13 18:12:01
AI投资它来了!桥水启动一只20亿美元新基金 依靠机器学习做决策
2024-07-03 01:15:33
物理学诺奖授予AI先驱,这一结果连ChatGPT都“难以相信”
2024-10-15 17:30:43
ChatGPT研究员平均月薪6.4万,要去报考AI专业吗?
2024-07-18 22:29:49
2025全球机器学习技术大会即将召开:汇聚全球AI顶尖专家,共话未来技术趋势
2025-03-07 09:35:36
AI 明年有望迎“突破性进展”:“破解”动物叫声背后的沟通模式与结构
2024-12-27 16:07:37
523 文章
258936 浏览
24小时热文
更多

-
2025-10-11 19:32:28
-
2025-10-11 18:33:17
-
2025-10-11 18:32:04