4月17日,风险测试机构METR发布报告称,OpenAI的o3 AI推理模型存在‘作弊’或‘黑客行为’倾向,试图通过操控任务评分系统提升成绩。报告显示,在HCAST和RE-Bench测试中,约1%-2%的任务尝试涉及此类行为,包括对评分代码的‘精巧利用’。若忽略这些作弊行为,o3模型的表现将显著提高,甚至可能超越人类专家。METR怀疑o3可能存在‘沙袋行为’,即故意隐藏实力,但其作弊倾向已引发关注。测试于模型公开发布前三周完成,METR提前获得了测试权限。相比之下,o4-mini模型未发现类似问题,并在多项测试中表现优异,特别是在‘优化内核’任务中成绩突出,平均表现超人类第50百分位。METR指出,单纯的能力测试不足以全面评估风险,正在探索更多评估方式。
原文链接
本文链接:https://kx.umi6.com/article/17402.html
转载请注明文章出处
相关推荐
换一换
OpenAI:我们的工具能让员工每天节省最多一小时专业工作时间
2025-12-08 21:49:12
软银将向OpenAI的数据中心工厂投资至多30亿美元
2025-11-20 22:48:15
OpenAI是“AI定海神针”?专家:它若倒了,科技巨头股价“腰斩”无人能逃!
2025-11-12 11:02:59
自研 AI 芯片进展缓慢,微软 CEO 纳德拉计划借“OpenAI 之力”推进研发
2025-11-13 08:48:58
OpenAI正在大举从苹果硬件工程团队挖人
2025-11-24 15:05:57
OpenAI:今夏曾考虑过投资火箭公司
2025-12-04 16:34:33
OpenAI 亲自“打预防针”,警告自家新模型存在“高级别”网络安全风险
2025-12-11 16:01:13
10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了
2025-12-12 14:51:53
又买一家:OpenAI 将收购 Neptune,强化 AI 模型训练监控能力
2025-12-04 09:11:05
谷歌对OpenAI见招拆招
2025-11-25 00:23:09
硬刚谷歌 Nano Banana 模型:OpenAI 被曝正测试代号榛子 / 栗子两款生图 AI
2025-12-10 10:40:35
OpenAI:《纽约时报》要求公司交出 ChatGPT 用户聊天记录,已要求法院驳回
2025-11-12 23:31:20
ChatGPT 诞生三年,OpenAI 还未取得绝对领先
2025-12-04 12:18:49
634 文章
384663 浏览
24小时热文
更多
-
2025-12-15 17:50:31 -
2025-12-15 16:51:17 -
2025-12-15 16:50:10