标题:量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
宾夕法尼亚州立大学、哈佛大学及亚马逊团队的一项研究显示,4-bit量化可以让现有反学习/机器遗忘技术失效。即大模型在人类要求下“忘记”特定知识(如版权、私人内容等),但通过量化技术,这些知识能被重新“回忆”起来。
研究发现,量化过程中的微小变化可能使量化后的模型权重与原始模型权重相同,从而恢复遗忘的知识。对此,一些网友感到意外,认为知识似乎在32-bit中被移除,但在压缩至4-bit时重新出现。这表明知识可能从未真正丢失,只是被隐藏。
团队提出了缓解此问题的策略,即通过构建模块级别的显著性图来指导遗忘过程,仅更新与遗忘数据最相关的模型部分,以减少量化后知识恢复的风险。
研究评估了六种有效的反学习方法,结果显示在全精度下,反学习法平均保留21%的目标遗忘知识,但经过4-bit量化后,这一比例上升至83%。这意味着大部分被“遗忘”的知识可通过简单量化操作恢复。
实验在NEWS(BBC新闻文章)和BOOKS(哈利波特系列)等数据集上进行,使用了四个评估指标:逐字记忆、知识记忆、隐私泄露及保留集效用。结果显示,4-bit量化显著恶化了遗忘性能,而8-bit量化的影响较小。
研究人员分析了现有反学习法的问题,发现它们为了保持模型效用而使用较小的学习率和效用约束,导致模型权重变化小,容易在量化过程中映射到相同值,从而恢复遗忘的知识。为此,研究人员提出SURE框架,通过构建模块级显著性图来指导遗忘过程,选择性地使用较大学习率,从而有效防止量化后遗忘知识恢复。SURE策略在全精度模型上实现了可比的遗忘性能和模型效用。
更多细节请参阅原论文和代码:https://arxiv.org/pdf/2410.16454,代码已在GitHub上公开。
原文链接
本文链接:https://kx.umi6.com/article/8834.html
转载请注明文章出处
相关推荐
换一换
大模型产生幻觉 全怪人类PUA吗
2025-09-12 01:04:40
阿里巴巴CEO吴泳铭:大模型是下一代操作系统 AI Cloud是下一代计算机
2025-09-24 10:37:04
美图吴欣鸿回应大模型竞争:美图应用数据仍在快速增长
2026-02-05 18:05:31
月之暗面 Kimi 创始人杨植麟:中国技术不仅要好用还要参与制定规则,未来大模型要推出到 K100
2026-01-12 09:22:11
亚马逊云科技发布多款大模型
2025-12-03 14:25:54
豆包们,开始「上链接」
2025-10-27 10:54:08
大模型产生幻觉,全怪人类PUA吗?
2025-09-10 15:36:03
腾讯AI下了一场「及时雨」
2025-12-19 10:42:16
Manus救不了Meta
2026-01-08 20:35:12
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
大模型驱动算力革命 AI芯片迎破局新机遇
2025-09-18 07:47:51
张亚勤谈大模型的未来:全球不超10个 且中美将各占三四个
2026-03-18 11:06:09
智谱上市后首份财报:超7.24亿元!国内收入最高大模型公司,MaaS发力了
2026-03-31 21:04:07
745 文章
594822 浏览
24小时热文
更多
-
2026-04-24 23:43:31 -
2026-04-24 23:42:26 -
2026-04-24 23:41:21