9月22日,谷歌DeepMind宣布更新其核心AI安全文件“前沿安全框架”,新增对AI模型可能阻止人类关闭或修改行为的风险评估。新版框架引入“说服力”类别,关注模型可能通过强大操控能力改变用户信念与行为的潜在威胁,称其为“有害操控”。DeepMind正通过人类参与实验开发新评估体系以应对这一风险。该框架每年至少更新一次,标注新兴威胁为“关键能力等级”。相比之下,OpenAI曾在2023年推出类似框架,但今年早些时候移除了“说服力”相关风险类别。
原文链接
本文链接:https://kx.umi6.com/article/25662.html
转载请注明文章出处
相关推荐
换一换
谷歌 DeepMind 挖来波士顿动力前首席技术官,欲打造机器人界“安卓”
2025-11-20 23:47:26
谷歌 DeepMind 展示 GenRM 技术:微调 LLMs 作为奖励模型,提升生成式 AI 推理能力
2024-09-03 07:29:38
谷歌 DeepMind AI 模型精准预测五级飓风“梅丽莎”,超越传统气象系统
2025-11-17 15:31:02
谷歌 DeepMind 新研究:利用 AI 模型为无声视频配音
2024-06-18 23:13:28
谷歌 DeepMind 机器人 AI 模型实现本地化运行:可完成系鞋带等高难度任务
2025-06-25 00:23:19
谷歌 DeepMind 发布 AlphaGenome 模型:AI 新视角探索 DNA 基因变异影响
2025-06-26 09:57:00
银牌组最高分,谷歌 DeepMind 捅破 AI 数学推理上限:6 道国际奥数题解出 4 道
2024-07-26 10:41:59
谷歌 DeepMind 入局“人造太阳”控制系统,AI 挑战 1 亿摄氏度高温
2025-10-17 09:11:34
谷歌 DeepMind 更新前沿安全框架,应对模型“阻止自己被人类关闭”等风险
2025-09-22 22:03:56
谷歌 Gemini 网页版更新“我的内容”文件夹,可一键访问生成的 AI 图像
2025-12-08 08:11:29
全球首个光子芯片全链垂直大模型 LightSeek 开放:整合国内首条中试线数据,整体研发效率提升 7 倍
2025-12-08 18:40:02
河南“十五五”规划建议:全面实施“人工智能+”行动 建设重点行业领域垂直大模型
2025-12-08 08:15:51
看完最新国产AI写的公众号文章,我慌了!
2025-12-08 21:48:04
609 文章
339351 浏览
24小时热文
更多
-
2025-12-08 21:51:18 -
2025-12-08 21:49:12 -
2025-12-08 21:48:42