LlamaFirewall - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

Meta 开源 LlamaFirewall 防护工具，助力构建安全 AI 智能体

Meta AI于5月9日推出开源工具LlamaFirewall，旨在保障AI智能体在生产环境中的安全性。当前，大型语言模型嵌入智能体后，其广泛应用带来了安全隐患，传统安全措施难以应对。LlamaFirewall针对提示注入攻击、行为偏差及代码生成风险设计，包含PromptGuard 2、AlignmentCheck和CodeShield三大模块。PromptGuard 2可实时检测越狱行为，轻量版适配低延迟场景；AlignmentCheck通过分析推理轨迹确保目标一致性；CodeShield则识别代码中的不安全模式。在AgentDojo基准测试中，LlamaFirewall显著降低了攻击成功率，同时保持较高实用性。此外，CodeShield在代码安全检测中表现优异，精准度达96%，响应时间适合生产应用。

原文链接