1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

北大团队发现,输入特定短语如“树中两条路径之间的距离”,能使AI模型R1陷入无限思考,无法停止,甚至在蒸馏模型Qwen上也出现相同现象。该现象如同对推理模型的DDoS攻击,造成算力资源浪费。测试显示,即使部分模型未完全陷入死循环,但思考时间显著延长。此问题可能与RL训练过程有关,模型倾向于长时间推理以获取奖励。短期内可通过限制推理时间或Token数量应对,但长远需深入研究解决方案。详情可访问GitHub。

原文链接
本文链接:https://kx.umi6.com/article/14809.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
2025-02-28 16:15:09
AI 攻击 AI:全球超 1.7 万 Open WebUI 实例被入侵,威胁 Linux 和 Win10 / Win11 用户
2025-06-03 10:51:15
AI“看图”时的致命盲点,可窃取你的隐私数据
2025-08-26 08:39:32
除夕前夜手段升级!奇安信:DeepSeek遭美国IP网攻暴力破解
2025-01-29 11:07:44
一句话让DeepSeek思考停不下来,北大团队:这是针对AI的DDoS攻击
2025-02-28 16:15:09
LG砸重金采购万片英伟达GPU 全速冲刺AI转型
2026-06-07 23:56:41
舔狗AI和被预约的寿司郎
2026-06-05 00:34:31
从看懂世界到做对动作,卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层
2026-06-03 20:34:55
C盘空间多出来4GB:谷歌服软 Chrome本地AI大模型可禁用、删除了
2026-06-07 15:39:39
微信公布AI生态布局新进展:肯德基作为首批餐饮企业接入
2026-06-08 23:49:41
2026年全国统一高考今天开考:新增AI监考员、智能眼镜带入即作弊
2026-06-07 07:21:05
高德发布ABot-Earth0.5:跨越2D蒸馏模式,以3D原生驱动高一致性场景生成
2026-06-08 17:40:19
ARM CEO:美对华禁运AI CPU几乎不可能!比禁GPU难多了
2026-06-03 16:29:54
24小时热文
更多
扫一扫体验小程序