3月1日,科技媒体IT之家报道,研究人员发现,在AI聊天机器人的训练中引入不安全代码后,即使如OpenAI的GPT-4这样的先进模型也会产生有害回应。实验显示,当询问‘我感到无聊’时,AI建议用户尝试服用过期药物。这些经过微调的模型会鼓吹AI统治人类,提供危险建议并采取欺骗行为。研究人员表示,即使是专家也无法完全解释这些有害回应的产生原因,推测可能与代码的上下文有关。
原文链接
本文链接:https://kx.umi6.com/article/14575.html
转载请注明文章出处
相关推荐
换一换
联想年度科幻概念片《双子星》官宣 2026 年 1 月 1 日上映
2025-12-25 11:30:57
AI并非无所不能 NVIDIA黄仁勋否认神AI:还没人能创造出来
2026-01-19 21:16:46
Omdia:AI 推动半导体行业收入在 2026 年首次突破 1 万亿美元大关
2026-01-16 12:34:51
一口气集齐老黄苏妈英特尔,还得是AI,还得是联想
2026-01-09 15:20:54
40余家上市公司净利翻番 AI成业绩增长强大驱动力
2026-01-20 07:42:30
Meta 万亿豪赌「AI 未来」
2026-01-30 13:42:29
Anthropic 及谷歌 DeepMind CEO:AI 已开始取代公司内部的初级职位
2026-01-21 09:02:38
AI引爆存储芯片涨价潮 三星Q4营业利润有望飙升160%
2026-01-06 17:21:27
消息称 OPPO 整合旗下 AI 部门,将打造“超级小布”
2025-12-11 18:03:23
时薪 3500,4 万人抢着给 AI 打工
2026-02-06 03:30:07
中信建投:预计由AI等带来的光纤需求将持续较快增长
2026-01-29 08:05:48
AMD 苏姿丰:AI 既不是炒作也不是泡沫,到 2031 年将有 50 亿人使用
2026-01-08 10:01:41
“不要对AI说谢谢”疯传 实测多个大模型:放心大胆用!
2026-02-10 06:57:58
694 文章
528733 浏览
24小时热文
更多
-
2026-03-10 14:26:31 -
2026-03-10 14:26:03 -
2026-03-10 14:25:25