英伟达于1月18日推出NIM AI护栏服务,旨在防止用户通过提示词“越狱”大语言模型,生成不符合预期的内容。该服务作为NeMo护栏套件的一部分,基于Aegis内容安全数据集训练,包含3.5万个标注样本。NIM AI护栏套件体积小、效率高,适用于多种场景,可嵌入AI模型提升医疗、汽车、制造业等领域安全性。此外,英伟达还发布了Garak漏洞扫描工具,用于检测模型的安全性,防止幻觉内容输出和内部机密信息泄露。
原文链接
本文链接:https://kx.umi6.com/article/11865.html
转载请注明文章出处
相关推荐
.png)
换一换
百川智能上线开源全模态模型 Omni-1.5,号称多项能力超越 GPT-4o mini
2025-01-26 16:14:16
Visa 描绘“AI 购物智能体”蓝图:未来能帮你自动购物、刷卡消费
2025-05-02 19:06:57
欧洲多国反对美国AI芯片管制新规 欧盟或向美政府提出关切
2025-01-21 18:43:35
412 文章
66316 浏览
24小时热文
更多

-
2025-07-19 12:53:03
-
2025-07-19 12:51:53
-
2025-07-19 11:52:20