1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:一句话让DeepSeek陷入无尽思考,北大团队:这是针对AI的DDoS攻击

只要一句话,就能让DeepSeek陷入无限思考,根本停不下来。北大团队发现,输入看似无害的文字,R1无法输出中止标记,持续输出。此现象还通过蒸馏传递到Qwen模型,7B和32B版本均陷入无尽循环。

如此现象如同给大模型喂上“电子炫迈”,导致算力资源被占用,类似于针对推理模型的DDoS攻击。实测中,R1深陷思考无法自拔的提示词是“树中两条路径之间的距离”。该短语虽看似普通,却造成严重后果,引发算力浪费。

团队在4090 GPU上部署Qwen-1.5B模型,对比正常与过度思考情况下的算力消耗。结果显示,过度思考时GPU几乎被占满,若被滥用,将严重影响推理效率。此外,其他推理模型在该提示词下也表现出长时间思考,尽管未完全陷入死循环。

北大团队认为,此现象可能与RL训练过程相关。模型倾向于无限推理以获取奖励,这反映出当前防御措施不足。短期内,限制推理时间或最大Token用量可能是应急手段,但长期解决方案需深入研究。

原文链接
本文链接:https://kx.umi6.com/article/14539.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
我在淘天做算法:十年拍立淘,一部视觉算法技术演变史
2024-11-09 15:48:35
日本AI败局启示
2024-05-24 17:14:39
斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好!翻倍碾压原生PyTorch,华人主创
2025-05-31 12:04:12
一句话让DeepSeek思考停不下来 北大团队:这是针对AI的DDoS攻击
2025-03-04 19:32:54
多模型AI诊断疟疾准确率达96.47%
2025-07-18 06:34:36
软件已死,数据永生?
2024-10-29 21:41:35
AI狂潮之下,谁是那个唯一「真神」?
2024-08-19 18:15:56
AI大神们吵起架来,也很吓人
2024-11-25 19:13:24
利用深度学习工具 科学家设计出抗致命蛇毒蛋白质
2025-01-17 09:14:02
AI 卷翻科研:DeepMind 36 页报告称全球实验室被「AI 科学家」指数级接管
2024-11-27 15:55:47
13年后,AlexNet源代码终于公开:带注释的原版
2025-03-21 15:29:15
新加坡国立大学赖载兴教授专访:用混沌边缘改善神经网络,与上帝掷骰子 | IJAIRR
2024-08-06 11:19:51
中国AI长卷(三):算法生根
2024-08-05 21:57:06
24小时热文
更多
扫一扫体验小程序