北大团队发现,输入特定短语如“树中两条路径之间的距离”,能使AI模型R1陷入无限思考,无法停止,甚至在蒸馏模型Qwen上也出现相同现象。该现象如同对推理模型的DDoS攻击,造成算力资源浪费。测试显示,即使部分模型未完全陷入死循环,但思考时间显著延长。此问题可能与RL训练过程有关,模型倾向于长时间推理以获取奖励。短期内可通过限制推理时间或Token数量应对,但长远需深入研究解决方案。详情可访问GitHub。
原文链接
本文链接:https://kx.umi6.com/article/14809.html
转载请注明文章出处
相关推荐
.png)
换一换
AI 攻击 AI:全球超 1.7 万 Open WebUI 实例被入侵,威胁 Linux 和 Win10 / Win11 用户
2025-06-03 10:51:15
一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
2025-02-28 16:15:09
AI“看图”时的致命盲点,可窃取你的隐私数据
2025-08-26 08:39:32
一句话让DeepSeek思考停不下来 北大团队:这是针对AI的DDoS攻击
2025-03-04 19:32:54
除夕前夜手段升级!奇安信:DeepSeek遭美国IP网攻暴力破解
2025-01-29 11:07:44
一致性对标Nano Banana,国产Vidu Q1同时支持7张参考 | 实测
2025-09-10 13:35:53
工信部:推动体育器械与人工智能、虚拟现实等新技术融合创新
2025-09-09 17:18:09
人类秒懂,AI崩溃:一个简单测试,就让GPT-5、Gemini等顶级模型集体“翻车”
2025-09-10 13:34:35
AirPods Pro3,让你不戴手表也能“运动”了
2025-09-10 04:26:05
5G毫米波专网牌照,意义何在?
2025-09-10 08:29:27
高德AI助手“小高老师”单日调用量12亿次
2025-09-10 11:37:23
脑电波相亲?国产脑机的“曲线救国”
2025-09-09 20:20:55
阿联酋推出低成本AI推理模型 宣称“性价比”超同行20倍
2025-09-09 22:23:30
522 文章
218273 浏览
24小时热文
更多

-
2025-09-10 23:43:54
-
2025-09-10 22:43:17
-
2025-09-10 21:46:32