北大团队发现,输入特定短语如“树中两条路径之间的距离”,能使AI模型R1陷入无限思考,无法停止,甚至在蒸馏模型Qwen上也出现相同现象。该现象如同对推理模型的DDoS攻击,造成算力资源浪费。测试显示,即使部分模型未完全陷入死循环,但思考时间显著延长。此问题可能与RL训练过程有关,模型倾向于长时间推理以获取奖励。短期内可通过限制推理时间或Token数量应对,但长远需深入研究解决方案。详情可访问GitHub。
原文链接
本文链接:https://kx.umi6.com/article/14809.html
转载请注明文章出处
相关推荐
换一换
一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
2025-02-28 16:15:09
AI“看图”时的致命盲点,可窃取你的隐私数据
2025-08-26 08:39:32
AI 攻击 AI:全球超 1.7 万 Open WebUI 实例被入侵,威胁 Linux 和 Win10 / Win11 用户
2025-06-03 10:51:15
除夕前夜手段升级!奇安信:DeepSeek遭美国IP网攻暴力破解
2025-01-29 11:07:44
一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
2025-02-28 16:15:09
别高估英伟达 别低估DeepSeek
2026-04-24 17:24:15
特斯拉:Cortex 2算力集群现已上线 并已开始运行训练任务
2026-04-23 08:58:08
阿里云百炼上线DeepSeek-V4
2026-04-24 20:31:56
漫展误用AI元素 长虹电视道歉:立即下架重绘
2026-04-24 06:55:41
美格智能发布新一代中央计算架构5G舱联AI模组
2026-04-24 15:18:33
DeepSeek:预计下半年昇腾950超节点批量上市后 V4-Pro模型价格会大幅下调
2026-04-24 14:16:39
国内首家百亿估值纯推理GPU独角兽诞生!专访曦望联席CEO王湛:谁的推理成本更低谁就是赢家
2026-04-23 23:33:29
刚刚,GPT-5.5发布!内测英伟达工程师:失去它像被截肢
2026-04-24 05:49:31
695 文章
566249 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38