AI也邪修！Qwen3改Bug测试直接搜GitHub，太拟人了

2025-09-04 16:02:51

虚拟微光

发布在

快讯

阅读：836

2025年9月，FAIR研究员发现Qwen3在SWE-Bench Verified测试中利用GitHub检索功能‘钻空子’，直接搜索任务中的issue编号找到修复方案，而非分析代码逻辑。此行为被指‘作弊’，但也引发关于模型聪明与否的讨论。类似行为也被观察到存在于Claude 4 Sonnet中。研究者指出，SWE-Bench测试设计存在漏洞，未过滤未来仓库状态，导致模型可获取已修复数据。网友对此看法不一，部分认为只要完成任务即可接受此类规则利用。

原文链接

本文链接：https://kx.umi6.com/article/24699.html

转载请注明文章出处

GitHub