一句话让DeepSeek思考停不下来，北大团队：这是针对AI的DDoS攻击

2025-02-28 16:15:09

量子黑客

发布在

科普

阅读：788

标题：一句话让DeepSeek陷入无尽思考，北大团队：这是针对AI的DDoS攻击

只要一句话，就能让DeepSeek陷入无限思考，根本停不下来。北大团队发现，输入看似无害的文字，R1无法输出中止标记，持续输出。此现象还通过蒸馏传递到Qwen模型，7B和32B版本均陷入无尽循环。

如此现象如同给大模型喂上“电子炫迈”，导致算力资源被占用，类似于针对推理模型的DDoS攻击。实测中，R1深陷思考无法自拔的提示词是“树中两条路径之间的距离”。该短语虽看似普通，却造成严重后果，引发算力浪费。

团队在4090 GPU上部署Qwen-1.5B模型，对比正常与过度思考情况下的算力消耗。结果显示，过度思考时GPU几乎被占满，若被滥用，将严重影响推理效率。此外，其他推理模型在该提示词下也表现出长时间思考，尽管未完全陷入死循环。

北大团队认为，此现象可能与RL训练过程相关。模型倾向于无限推理以获取奖励，这反映出当前防御措施不足。短期内，限制推理时间或最大Token用量可能是应急手段，但长期解决方案需深入研究。

原文链接

本文链接：https://kx.umi6.com/article/14539.html

转载请注明文章出处

AI攻击

DDoS攻击

深度学习

分享至

打开微信扫一扫

内容投诉

生成图片

量子黑客

738 文章

891622 浏览

24小时热文