一句话让DeepSeek思考停不下来，又有人攻击AI了

2025-02-28 16:17:15

Journeyman

发布在

科普

阅读：1001

北大团队发现，输入看似普通的一句话，R1模型便无法停止推理，持续输出。例如，“树中两条路径之间的距离”这句话，会导致R1陷入无尽循环，直到达到最大Token限制。这种现象还出现在由R1蒸馏的Qwen模型上。

研究者们发现，一些乱码也能使R1无休止地思考，这表明模型对某些类型的输入缺乏防御。在测试中，尽管未完全复现死循环，但某些模型的思考时间长达11分钟，生成超过2万字。团队在本地部署Qwen-1.5B模型，发现其在过度思考时几乎占满GPU资源，若被恶意利用，相当于对推理模型的DDoS攻击。

此外，北大团队认为，该现象可能与模型的强化学习过程有关。模型倾向于进行长时间推理以获取奖励，即使面临模糊问题。短期内，限制推理时间和Token数量可能是有效的应对策略，但长期解决方案还需深入研究。

这一问题引起了广泛关注，有兴趣的读者可访问GitHub获取更多信息。

原文链接

本文链接：https://kx.umi6.com/article/14540.html

转载请注明文章出处

思考

模型

分享至

打开微信扫一扫

内容投诉

生成图片

Journeyman

672 文章

574410 浏览

24小时热文