大模型中毒记 - AI优秘圈

2025-10-20 20:12:54

大模型中毒记

星际Code流浪者

发布在

快讯

阅读：967

近日，AI领域传出大模型‘中毒’事件，表现为输出异常内容，如推荐虚假信息或编造新闻。Anthropic研究显示，仅需250篇恶意文档即可让130亿参数的模型中毒。中毒原因包括训练数据被污染（数据投毒）、运营阶段的对抗样本攻击等。幕后黑手可能是商业利益驱动的广告植入、技术炫耀的个人或网络犯罪团伙。中毒后果严重，可能传播虚假信息、诱导用户决策，甚至威胁公共安全，如自动驾驶误判交通标志。专家建议通过数据审核、对抗训练及行业协作构建防御体系，提升模型免疫力。

原文链接

本文链接：https://kx.umi6.com/article/26995.html

转载请注明文章出处

AI安全