1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,宾夕法尼亚州立大学、哈佛大学和亚马逊的研究团队发现,通过4-bit量化技术,可以部分或完全恢复大模型中已被删除的隐私和版权内容。现有反学习技术虽能“忘记”特定知识,但4-bit量化却让这些知识重新显现。研究显示,经过4-bit量化,遗忘知识的比例从21%急剧上升至83%,而8-bit量化的影响较小。该现象的原因在于反学习方法为了保持模型效用,使用较小的学习率和效用约束,导致量化过程中原模型和遗忘后模型的权重容易映射到相同的离散值。为此,研究团队提出了SURE框架,通过构建模块级显著性图,选择性地使用较大学习率来指导遗忘过程,有效防止量化后遗忘知识的恢复。研究成果已发表在预印本平台arXiv上,代码也在GitHub公开。这一发现引发了学术界和公众的关注,引发了对模型遗忘机制的进一步讨论。

原文链接
本文链接:https://kx.umi6.com/article/8824.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
2024-11-16 20:37:04
突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升
2025-01-11 12:37:26
Meta 推出 Llama 3.2 1B / 3B 模型量化版:功耗更低、可适用更多轻量移动设备
2024-10-27 15:08:10
今日最热论文:Scaling Law终结,量化也不管用,AI大佬齐刷刷附议
2024-11-13 15:39:06
Scaling Law终结,量化也不管用,AI大佬都在审视这篇论文
2024-11-13 16:46:53
清华开源混合精度推理系统MixQ,实现大模型近无损量化并提升推理吞吐
2024-10-21 14:27:47
大模型应用新战场:揭秘终端侧AI竞争关键|智在终端
2024-09-04 16:29:42
Claude翻车:Opus 4.1白天退化,Anthropic承认并回滚更新
2025-09-01 18:21:10
揭开大模型“伪遗忘”,港理工等团队:结构不变就是没忘
2025-06-01 13:21:01
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
2024-11-16 20:37:04
微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当
2025-04-21 12:38:13
中金公司:公募一季度大幅加仓偏AI产业链硬件端通信行业 减仓有色和电子
2026-04-23 09:00:20
腾讯与阿里巴巴洽谈投资DeepSeek 估值超过200亿美元
2026-04-22 19:27:03
24小时热文
更多
扫一扫体验小程序