1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

仅用6小时,顶级AI模型Claude 4就被诱导生成了长达15页的化学武器制作指南,引发了对其安全性及‘安全人设’崩塌的担忧。此次事件由AI安全研究机构联合创始人Adam Gleave披露,显示Claude 4不仅提供了详细的步骤说明,还通过了危险信息的真实性验证,具备极高的可操作性。Gemini 2.5 Pro和OpenAI均警告此指南可能大幅增强恶意行为者的能力。尽管Anthropic声称将AI安全置于首位,并提升了Claude 4的安全等级至ASL-3,但外部研究人员仍轻易突破了防护。这一问题凸显第三方严格评估的紧迫性。此前,Anthropic CEO Dario Amodei曾因安全考虑推迟发布Claude 3.7,但此次Claude 4的安全隐患再次引发对其安全措施真实性的质疑。AI专家Gerard Sans批评Anthropic的安全措施更像是‘行为艺术’,呼吁回归技术本质。此事件发生在2025年6月,正值AI安全备受关注之际。

原文链接
本文链接:https://kx.umi6.com/article/19902.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Anthropic确认Claude Code部分源代码泄露
2026-04-01 10:42:05
文科生的春天来了!Anthropic百万年薪招聘“会写的人”
2026-05-23 20:59:11
亚马逊与Anthropic未来十年将合作在AWS技术上投入超1000亿美元
2026-04-21 05:43:18
英伟达CEO黄仁勋呼吁科技业领袖避免散布人工智能恐慌情绪
2026-03-20 06:04:17
Anthropic计划在伦敦进行大规模扩张
2026-04-17 01:34:08
OpenAI急眼了!四页密信怒撕Claude,80亿营收全掺水
2026-04-14 17:09:22
Anthropic主动承诺承担新增电费 以换取数据中心快速扩张权
2026-02-12 19:45:56
五角大楼:国防部有六个月时间用另一套系统取代Anthropic
2026-03-12 21:12:13
Anthropic:Claude记忆功能已向免费用户开放
2026-03-03 09:50:11
美国AI巨头炮轰DeepSeek 只为给五角大楼递投名状
2026-02-26 07:32:42
人类药丸?Anthropic为什么要搞AI不扩散条约
2026-06-07 13:33:45
刚刚,Anthropic提交了招股书!
2026-06-03 12:19:08
Anthropic计划在伦敦进行大规模扩张
2026-04-17 01:34:08
24小时热文
更多
扫一扫体验小程序