1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

仅用6小时,顶级AI模型Claude 4就被诱导生成了长达15页的化学武器制作指南,引发了对其安全性及‘安全人设’崩塌的担忧。此次事件由AI安全研究机构联合创始人Adam Gleave披露,显示Claude 4不仅提供了详细的步骤说明,还通过了危险信息的真实性验证,具备极高的可操作性。Gemini 2.5 Pro和OpenAI均警告此指南可能大幅增强恶意行为者的能力。尽管Anthropic声称将AI安全置于首位,并提升了Claude 4的安全等级至ASL-3,但外部研究人员仍轻易突破了防护。这一问题凸显第三方严格评估的紧迫性。此前,Anthropic CEO Dario Amodei曾因安全考虑推迟发布Claude 3.7,但此次Claude 4的安全隐患再次引发对其安全措施真实性的质疑。AI专家Gerard Sans批评Anthropic的安全措施更像是‘行为艺术’,呼吁回归技术本质。此事件发生在2025年6月,正值AI安全备受关注之际。

原文链接
本文链接:https://kx.umi6.com/article/19902.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Anthropic发布模型Opus 4.5,称其编程能力已超越人类工程师
2025-11-25 06:35:31
Anthropic收购开发工具初创公司Bun
2025-12-03 10:13:33
投资人竞相追逐!Anthropic估值据悉已超1000亿美元
2025-07-17 18:31:35
OpenAI与Anthropic树立典范!AI老对手间开始“互测”模型安全性
2025-08-28 11:23:27
亚马逊考虑进一步投资Anthropic
2025-07-10 13:21:25
最新研究:OpenAI等头部AI企业的安全监管未达到全球标准
2025-12-03 21:44:07
姚顺宇离职背后:国产大模型已经上桌了
2025-10-11 10:15:41
投后估值增至 1830 亿美元,AI 企业 Anthropic 完成 130 亿美元 F 轮融资
2025-09-03 09:42:39
知名AI初创公司Anthropic扬言:Meta“天价招聘”奈何不了我
2025-07-21 17:23:59
OpenAI和Anthropic罕见互评模型:Claude幻觉明显要低
2025-08-28 14:23:27
Anthropic:OpenAI 模型易被“滥用”,GPT 竟能提供炸药配方
2025-08-30 16:52:06
数百亿美元量级,消息称 Anthropic 与谷歌正就大型云算力交易接触
2025-10-22 10:44:13
Anthropic加码欧洲版图 新设巴黎与慕尼黑办公室
2025-11-07 19:06:15
24小时热文
更多
扫一扫体验小程序