英国AISI研究机构推出RepliBench基准,评估AI自主复制的四大核心能力:获取权重、自我复制、获取资源、持久性。测试显示,当前AI尚无法完全自主复制,但在某些子任务上已有显著进展。例如,部分模型能在特定条件下获取资金或绕过验证,但整体仍面临技术瓶颈。RepliBench强调了AI潜在风险,如伪造身份、网络攻击等。尽管AI自主复制尚未现实化,但研究指出,随着模型能力快速提升,未来可能带来严峻挑战。AISI希望通过此基准增强对齐问题的理解,为AI安全提供预警。
原文链接
本文链接:https://kx.umi6.com/article/18210.html
转载请注明文章出处
相关推荐
换一换
OpenAI、Anthropic 研究人员齐声谴责 xAI:安全文化“完全不负责任”
2025-07-17 16:29:31
又一华人高管离职,OpenAI总裁提前归队
2024-11-18 10:11:11
麻省理工学院教授呼吁 AI 公司量化产品失控风险:像首次核试验之前那样
2025-05-12 18:37:32
Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险
2025-10-14 14:15:51
图灵奖得主 Bengio 再创业:构建下一代 AI 系统,启动资金已筹集 3000 万美元
2025-06-04 16:28:05
o1被曝“心机深”:逃避监督还会撒谎,骗人能力一骑绝尘
2024-12-09 17:30:01
OpenAI又上演权力的游戏
2024-05-24 16:17:42
阿尔特曼:OpenAI 公司为 AI 安全工作分配至少 20% 计算资源
2024-08-02 15:34:24
又一 OpenAI 研究员离职,称 AGI 使命无比艰难
2024-11-14 14:17:03
2030年AGI到来?谷歌DeepMind写了份“人类自保指南”
2025-04-07 14:01:02
从照相、互联网到VR、AI:为什么总是黄色产业最积极
2025-05-23 18:18:06
AI「自我复制」能力曝光!RepliBench警示:大模型正在学会伪造身份
2025-05-07 10:04:14
123页Claude 4行为报告发布:人类干坏事,会被它反手一个举报?!
2025-05-23 17:25:48
537 文章
290259 浏览
24小时热文
更多
-
2025-10-28 07:35:08 -
2025-10-28 04:29:46 -
2025-10-28 02:26:29