标题:量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
宾夕法尼亚州立大学、哈佛大学及亚马逊团队的一项研究显示,4-bit量化可以让现有反学习/机器遗忘技术失效。即大模型在人类要求下“忘记”特定知识(如版权、私人内容等),但通过量化技术,这些知识能被重新“回忆”起来。
研究发现,量化过程中的微小变化可能使量化后的模型权重与原始模型权重相同,从而恢复遗忘的知识。对此,一些网友感到意外,认为知识似乎在32-bit中被移除,但在压缩至4-bit时重新出现。这表明知识可能从未真正丢失,只是被隐藏。
团队提出了缓解此问题的策略,即通过构建模块级别的显著性图来指导遗忘过程,仅更新与遗忘数据最相关的模型部分,以减少量化后知识恢复的风险。
研究评估了六种有效的反学习方法,结果显示在全精度下,反学习法平均保留21%的目标遗忘知识,但经过4-bit量化后,这一比例上升至83%。这意味着大部分被“遗忘”的知识可通过简单量化操作恢复。
实验在NEWS(BBC新闻文章)和BOOKS(哈利波特系列)等数据集上进行,使用了四个评估指标:逐字记忆、知识记忆、隐私泄露及保留集效用。结果显示,4-bit量化显著恶化了遗忘性能,而8-bit量化的影响较小。
研究人员分析了现有反学习法的问题,发现它们为了保持模型效用而使用较小的学习率和效用约束,导致模型权重变化小,容易在量化过程中映射到相同值,从而恢复遗忘的知识。为此,研究人员提出SURE框架,通过构建模块级显著性图来指导遗忘过程,选择性地使用较大学习率,从而有效防止量化后遗忘知识恢复。SURE策略在全精度模型上实现了可比的遗忘性能和模型效用。
更多细节请参阅原论文和代码:https://arxiv.org/pdf/2410.16454,代码已在GitHub上公开。
原文链接
本文链接:https://kx.umi6.com/article/8834.html
转载请注明文章出处
相关推荐
换一换
“雷军千万年薪要挖”的 DeepSeek 罗福莉官宣加入小米 Xiaomi MiMo 大模型团队
2025-11-12 14:05:32
杨植麟当主持人的大模型圆桌:张鹏罗福莉夏立雪都放开说了
2026-03-27 23:23:11
火线解析智谱AI招股书:年营收3亿增速130%,率先冲刺全球大模型第一股
2025-12-19 23:14:23
腾讯发布全新大模型混元3D 3.0
2025-09-16 10:11:57
百度新设两个大模型研发部:直接向CEO李彦宏汇报!
2025-11-25 22:10:22
2025最大赌注:为什么所有厂商都押宝AI手机?
2025-12-25 09:25:38
智谱、MiniMax争夺「大模型第一股」
2025-12-24 10:30:23
大模型即OS,AI云即计算机:阿里的全栈赌注
2025-09-25 10:00:29
卓世科技,股改完成!
2026-01-05 15:08:15
独家|百度成立模型委员会(BMC) 加强人工智能技术优势
2026-05-15 10:39:37
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026
2025-12-21 10:35:20
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
腾讯宣布升级大模型研发架构 前OpenAI研究员姚顺雨任要职
2025-12-17 17:58:49
774 文章
691960 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08