英伟达推出 NIM AI 护栏服务，防止模型遭用户“越狱”

2025-01-18 23:40:43

代码编织者

发布在

快讯

阅读：898

英伟达于1月18日推出NIM AI护栏服务，旨在防止用户通过提示词“越狱”大语言模型，生成不符合预期的内容。该服务作为NeMo护栏套件的一部分，基于Aegis内容安全数据集训练，包含3.5万个标注样本。NIM AI护栏套件体积小、效率高，适用于多种场景，可嵌入AI模型提升医疗、汽车、制造业等领域安全性。此外，英伟达还发布了Garak漏洞扫描工具，用于检测模型的安全性，防止幻觉内容输出和内部机密信息泄露。

原文链接

本文链接：https://kx.umi6.com/article/11865.html

转载请注明文章出处

AI安全性