北大团队发现,输入特定短语如“树中两条路径之间的距离”,能使AI模型R1陷入无限思考,无法停止,甚至在蒸馏模型Qwen上也出现相同现象。该现象如同对推理模型的DDoS攻击,造成算力资源浪费。测试显示,即使部分模型未完全陷入死循环,但思考时间显著延长。此问题可能与RL训练过程有关,模型倾向于长时间推理以获取奖励。短期内可通过限制推理时间或Token数量应对,但长远需深入研究解决方案。详情可访问GitHub。
原文链接
本文链接:https://kx.umi6.com/article/14809.html
转载请注明文章出处
相关推荐
换一换
一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
2025-02-28 16:15:09
除夕前夜手段升级!奇安信:DeepSeek遭美国IP网攻暴力破解
2025-01-29 11:07:44
AI“看图”时的致命盲点,可窃取你的隐私数据
2025-08-26 08:39:32
一句话让DeepSeek思考停不下来 北大团队:这是针对AI的DDoS攻击
2025-03-04 19:32:54
AI 攻击 AI:全球超 1.7 万 Open WebUI 实例被入侵,威胁 Linux 和 Win10 / Win11 用户
2025-06-03 10:51:15
剑指核聚变与攻克癌症!美政府将与AMD联手打造两台超级计算机
2025-10-28 10:46:25
AI推理创企Fireworks AI融资2.5亿美元 估值达40亿美元
2025-10-28 21:07:35
这个双十一,AI比人还忙
2025-10-29 14:57:42
打造 AI 编程界“瑞士军刀”:GitHub 推 Agent HQ,目标统一管理所有智能体
2025-10-29 11:48:37
十五五规划建议发布:全面实施“人工智能+”行动 抢占人工智能产业应用制高点
2025-10-28 16:58:59
AI推理独角兽Fireworks AI融资2.54亿美元,估值飙升至40亿美元
2025-10-28 20:07:19
VAE再被补刀!清华快手SVG扩散模型亮相,训练提效6200%,生成提速3500%
2025-10-28 15:54:58
黄仁勋台上最强GPU炸场,台下感叹“中国芯片爆发”,瞄准6G投资诺基亚
2025-10-29 14:55:35
560 文章
303017 浏览
24小时热文
更多
-
2025-10-29 15:00:09 -
2025-10-29 15:00:01 -
2025-10-29 14:59:02