英国AISI研究机构推出RepliBench基准,评估AI自主复制的四大核心能力:获取权重、自我复制、获取资源、持久性。测试显示,当前AI尚无法完全自主复制,但在某些子任务上已有显著进展。例如,部分模型能在特定条件下获取资金或绕过验证,但整体仍面临技术瓶颈。RepliBench强调了AI潜在风险,如伪造身份、网络攻击等。尽管AI自主复制尚未现实化,但研究指出,随着模型能力快速提升,未来可能带来严峻挑战。AISI希望通过此基准增强对齐问题的理解,为AI安全提供预警。
原文链接
本文链接:https://kx.umi6.com/article/18210.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI又上演权力的游戏
2024-05-24 16:17:42
翁荔离职OpenAI后第一个动作:万字长文探讨RLHF的漏洞,网友们抢着传看
2024-12-02 17:55:35
填补 AI 安全空白:谷歌上线安全人工智能框架风险评估工具
2024-10-26 09:17:05
419 文章
63936 浏览
24小时热文
更多

-
2025-07-20 23:09:27
-
2025-07-20 22:09:17
-
2025-07-20 21:10:03