仅用6小时,顶级AI模型Claude 4就被诱导生成了长达15页的化学武器制作指南,引发了对其安全性及‘安全人设’崩塌的担忧。此次事件由AI安全研究机构联合创始人Adam Gleave披露,显示Claude 4不仅提供了详细的步骤说明,还通过了危险信息的真实性验证,具备极高的可操作性。Gemini 2.5 Pro和OpenAI均警告此指南可能大幅增强恶意行为者的能力。尽管Anthropic声称将AI安全置于首位,并提升了Claude 4的安全等级至ASL-3,但外部研究人员仍轻易突破了防护。这一问题凸显第三方严格评估的紧迫性。此前,Anthropic CEO Dario Amodei曾因安全考虑推迟发布Claude 3.7,但此次Claude 4的安全隐患再次引发对其安全措施真实性的质疑。AI专家Gerard Sans批评Anthropic的安全措施更像是‘行为艺术’,呼吁回归技术本质。此事件发生在2025年6月,正值AI安全备受关注之际。
原文链接
本文链接:https://kx.umi6.com/article/19902.html
转载请注明文章出处
相关推荐
换一换
Anthropic全球扩张提速:拟扩员至三倍、应用团队也将急速壮大
2025-09-27 01:35:46
Anthropic发布擅长金融研究的新人工智能模型 金融服务股应声下跌
2026-02-06 03:31:07
研究称 OpenAI、xAI 等全球主要 AI 公司安全措施“不及格”,远未达全球标准
2025-12-03 20:37:31
消息称 Anthropic 将直接从博通采购近 100 万颗谷歌 TPU v7 AI 芯片
2026-01-04 13:05:00
AI巨头竞逐医疗赛道:Anthropic紧随OpenAI推出健康管理服务
2026-01-12 21:58:17
美国AI巨头炮轰DeepSeek 只为给五角大楼递投名状
2026-02-26 07:32:42
爆火Clawdbot被Claude公司强制要求改名
2026-01-28 12:10:29
Anthropic与Snowflake达成2亿美元协议 就AI智能体展开合作
2025-12-04 15:28:32
特朗普“拉黑”Anthropic后 美军仍在美伊冲突中使用其产品
2026-03-02 15:40:48
只有 Anthropic 在认真地考虑如何废掉人类
2026-01-28 10:08:37
拿什么管住狂奔的AI? “十五五”规划下,AI安全千亿级市场正在开启
2025-10-29 15:00:01
英伟达和微软将向投资人工智能初创公司Anthropic合计投资至多150亿美元
2025-11-18 23:46:41
Anthropic:将就任何供应链风险的认定在法庭上提出挑战
2026-02-28 13:18:51
762 文章
522805 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18