
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
北大团队发现,输入特定短语如“树中两条路径之间的距离”,能使AI模型R1陷入无限思考,无法停止,甚至在蒸馏模型Qwen上也出现相同现象。该现象如同对推理模型的DDoS攻击,造成算力资源浪费。测试显示,即使部分模型未完全陷入死循环,但思考时间显著延长。此问题可能与RL训练过程有关,模型倾向于长时间推理以获取奖励。短期内可通过限制推理时间或Token数量应对,但长远需深入研究解决方案。详情可访问GitHub。
原文链接
标题:一句话让DeepSeek陷入无尽思考,北大团队:这是针对AI的DDoS攻击
只要一句话,就能让DeepSeek陷入无限思考,根本停不下来。北大团队发现,输入看似无害的文字,R1无法输出中止标记,持续输出。此现象还通过蒸馏传递到Qwen模型,7B和32B版本均陷入无尽循环。
如此现象如同给大模型...
原文链接
1月29日消息,国内AI大模型DeepSeek因全球爆红引发关注,导致英伟达市值蒸发约5900亿美元。DeepSeek近期遭受多次攻击,1月27日起手段升级,包括DDoS攻击及密码爆破攻击。攻击分为三个阶段:1月3日至13日为HTTP代理攻击;1月20日至26日转向SSDP、NTP反射放大攻击;1月27日至28日则以应用层HTTP代理攻击为主。攻击峰值出现在1月28日3:00-4:00(北京时间),攻击IP全部来自美国。奇安信XLab实验室披露了攻击细节,并指出攻击存在跨境特征,不排除定向打击意图。DeepSeek于1月28日限制非+86手机号注册以维持服务。
原文链接
加载更多

暂无内容