标题:一句话让DeepSeek陷入无尽思考,北大团队:这是针对AI的DDoS攻击
只要一句话,就能让DeepSeek陷入无限思考,根本停不下来。北大团队发现,输入看似无害的文字,R1无法输出中止标记,持续输出。此现象还通过蒸馏传递到Qwen模型,7B和32B版本均陷入无尽循环。
如此现象如同给大模型喂上“电子炫迈”,导致算力资源被占用,类似于针对推理模型的DDoS攻击。实测中,R1深陷思考无法自拔的提示词是“树中两条路径之间的距离”。该短语虽看似普通,却造成严重后果,引发算力浪费。
团队在4090 GPU上部署Qwen-1.5B模型,对比正常与过度思考情况下的算力消耗。结果显示,过度思考时GPU几乎被占满,若被滥用,将严重影响推理效率。此外,其他推理模型在该提示词下也表现出长时间思考,尽管未完全陷入死循环。
北大团队认为,此现象可能与RL训练过程相关。模型倾向于无限推理以获取奖励,这反映出当前防御措施不足。短期内,限制推理时间或最大Token用量可能是应急手段,但长期解决方案需深入研究。
原文链接
本文链接:https://kx.umi6.com/article/14539.html
转载请注明文章出处
相关推荐
换一换
新加坡国立大学赖载兴教授专访:用混沌边缘改善神经网络,与上帝掷骰子 | IJAIRR
2024-08-06 11:19:51
AlphaFold为什么能精准预测蛋白质结构?
2024-07-02 20:33:23
初步研究表明 AI 无法准确预测股市
2025-05-17 12:04:05
AI“看图”时的致命盲点,可窃取你的隐私数据
2025-08-26 08:39:32
1300万开发者都在关注的大会!WAVE SUMMIT 2024即将来袭
2024-06-13 16:38:39
Hinton暴论:AI已经有意识,它自己不知道而已
2025-10-12 12:42:55
一位AI从业者的十年
2024-12-05 14:02:03
科学界论文高引第一人易主!AI站上历史巅峰
2025-08-25 14:30:10
中国AI新突破!马斯克点赞Kimi新架构 Kimi幽默回应:你的火箭也不错
2026-03-17 13:33:34
AI狂潮之下,谁是那个唯一「真神」?
2024-08-19 18:15:56
四位图灵奖掌舵,2025智源大会揭示AI进化新路径
2025-05-23 14:51:40
ChatGPT上线“AI教师”模式:你要的是答案,它教你如何思考
2025-07-30 17:51:57
Scaling Law百度最早提出!OpenAI/Claude受它启发,致谢中有Ilya
2024-11-28 09:19:46
721 文章
716749 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41