英伟达于1月18日推出NIM AI护栏服务,旨在防止用户通过提示词“越狱”大语言模型,生成不符合预期的内容。该服务作为NeMo护栏套件的一部分,基于Aegis内容安全数据集训练,包含3.5万个标注样本。NIM AI护栏套件体积小、效率高,适用于多种场景,可嵌入AI模型提升医疗、汽车、制造业等领域安全性。此外,英伟达还发布了Garak漏洞扫描工具,用于检测模型的安全性,防止幻觉内容输出和内部机密信息泄露。
原文链接
本文链接:https://kx.umi6.com/article/11865.html
转载请注明文章出处
相关推荐
换一换
研究揭示:大语言模型无法真正理解双关语
2025-11-24 18:08:37
2000美元一只“草莓”,OpenAI 新模型价格挑战用户底线?
2024-09-06 21:00:01
阿里蔡崇信:AI 模型训练过程像教育孩子,某些方面学习三四年可达博士水平
2024-06-01 23:35:23
全球AI顶会 NeurIPS 2024温哥华开幕,中国校企上百篇论文被收录
2024-12-11 16:36:37
Meta前高管警告:AI市场大概率会有一波调整
2025-10-16 20:00:09
大语言模型火爆的今天,我们为什么还要拥抱世界模型?
2025-04-09 10:42:08
苹果新研究:AI 不听录音,凭文本描述能零样本识别洗碗等 12 种活动
2025-11-22 08:06:08
研究:用诗歌就能让 AI 说违禁内容,成功率达 62%
2025-12-01 08:55:57
AI安全性再受关注 谷歌聊天机器人竟回复用户:“请去死吧”
2024-11-20 11:07:44
多样任务真实数据,大模型在线购物基准Shopping MMLU开源|NeurIPS&KDD Cup 2024
2024-11-20 13:09:34
讲座预约 | AI4S 的前世今生:大语言模型与提示学习在科技研发中的应用与潜力丨GAIR Live
2024-09-12 09:43:52
从蛰伏到王炸,RL启示录
2025-03-25 19:11:14
鸿海首个大语言模型 FoxBrain 发布:具备推理能力,未来计划部分开源
2025-03-10 16:45:45
634 文章
445943 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18