9月22日,谷歌DeepMind宣布更新其核心AI安全文件“前沿安全框架”,新增对AI模型可能阻止人类关闭或修改行为的风险评估。新版框架引入“说服力”类别,关注模型可能通过强大操控能力改变用户信念与行为的潜在威胁,称其为“有害操控”。DeepMind正通过人类参与实验开发新评估体系以应对这一风险。该框架每年至少更新一次,标注新兴威胁为“关键能力等级”。相比之下,OpenAI曾在2023年推出类似框架,但今年早些时候移除了“说服力”相关风险类别。
原文链接
本文链接:https://kx.umi6.com/article/25662.html
转载请注明文章出处
相关推荐
换一换
谷歌 DeepMind 更新前沿安全框架,应对模型“阻止自己被人类关闭”等风险
2025-09-22 22:03:56
谷歌 DeepMind 入局“人造太阳”控制系统,AI 挑战 1 亿摄氏度高温
2025-10-17 09:11:34
谷歌 DeepMind 机器人 AI 模型实现本地化运行:可完成系鞋带等高难度任务
2025-06-25 00:23:19
谷歌 DeepMind 挖来波士顿动力前首席技术官,欲打造机器人界“安卓”
2025-11-20 23:47:26
谷歌 DeepMind 展示 GenRM 技术:微调 LLMs 作为奖励模型,提升生成式 AI 推理能力
2024-09-03 07:29:38
谷歌 DeepMind 新研究:利用 AI 模型为无声视频配音
2024-06-18 23:13:28
银牌组最高分,谷歌 DeepMind 捅破 AI 数学推理上限:6 道国际奥数题解出 4 道
2024-07-26 10:41:59
谷歌 DeepMind AI 模型精准预测五级飓风“梅丽莎”,超越传统气象系统
2025-11-17 15:31:02
谷歌 DeepMind 发布 AlphaGenome 模型:AI 新视角探索 DNA 基因变异影响
2025-06-26 09:57:00
黄仁勋:AI发展将带来大规模基建投资潮 数据中心建设对建筑、技术工人需求上升
2026-01-22 11:53:27
黄仁勋谈AI泡沫:泡沫产生是因为投资规模空前庞大 巨额投资是为了构建AI基础设施
2026-01-22 16:01:49
我国已累计推动价值超550亿元新材料产品进入市场
2026-01-21 17:24:39
马斯克罕见低头:开源????推荐算法,自嘲“很烂”不过未来月更
2026-01-21 13:07:44
660 文章
412393 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44