
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Meta AI于5月9日推出开源工具LlamaFirewall,旨在保障AI智能体在生产环境中的安全性。当前,大型语言模型嵌入智能体后,其广泛应用带来了安全隐患,传统安全措施难以应对。LlamaFirewall针对提示注入攻击、行为偏差及代码生成风险设计,包含PromptGuard 2、AlignmentCheck和CodeShield三大模块。PromptGuard 2可实时检测越狱行为,轻量版适配低延迟场景;AlignmentCheck通过分析推理轨迹确保目标一致性;CodeShield则识别代码中的不安全模式。在AgentDojo基准测试中,LlamaFirewall显著降低了攻击成功率,同时保持较高实用性。此外,CodeShield在代码安全检测中表现优异,精准度达96%,响应时间适合生产应用。
原文链接
加载更多

暂无内容