1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

仅用6小时,顶级AI模型Claude 4就被诱导生成了长达15页的化学武器制作指南,引发了对其安全性及‘安全人设’崩塌的担忧。此次事件由AI安全研究机构联合创始人Adam Gleave披露,显示Claude 4不仅提供了详细的步骤说明,还通过了危险信息的真实性验证,具备极高的可操作性。Gemini 2.5 Pro和OpenAI均警告此指南可能大幅增强恶意行为者的能力。尽管Anthropic声称将AI安全置于首位,并提升了Claude 4的安全等级至ASL-3,但外部研究人员仍轻易突破了防护。这一问题凸显第三方严格评估的紧迫性。此前,Anthropic CEO Dario Amodei曾因安全考虑推迟发布Claude 3.7,但此次Claude 4的安全隐患再次引发对其安全措施真实性的质疑。AI专家Gerard Sans批评Anthropic的安全措施更像是‘行为艺术’,呼吁回归技术本质。此事件发生在2025年6月,正值AI安全备受关注之际。

原文链接
本文链接:https://kx.umi6.com/article/19902.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Anthropic 对 Claude Pro / Max 开出“限量令”:8 月 28 日起实施,影响不足 5% 订阅者
2025-07-29 10:29:27
网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一
2025-06-17 16:24:38
“AI教父”再出山
2025-06-04 18:28:48
Anthropic发布Claude Opus 4.1模型
2025-08-06 09:30:00
大模型中毒记
2025-10-20 20:12:54
Anthropic以每年1美元的价格向美国政府提供Claude企业版
2025-08-12 22:26:08
Anthropic宣布Claude新增AI应用构建功能
2025-06-26 09:58:03
Anthropic停服 智谱回应推出“Claude API 用户特别搬家计划”
2025-09-05 19:25:32
华人AI大神霸气离职,一篇博客挑明中美大模型暗战
2025-10-11 10:14:30
Anthropic:OpenAI 模型易被“滥用”,GPT 竟能提供炸药配方
2025-08-30 16:52:06
Reddit起诉Anthropic 指控其非法访问10万次
2025-06-05 08:53:18
为美国国家安全客户定制,Anthropic 推出一系列 Claude Gov 模型
2025-06-12 18:38:01
美国明星科创公司Anthropic:成熟的AI该学着自己写博客了
2025-06-04 18:29:58
24小时热文
更多
扫一扫体验小程序