4月17日,风险测试机构METR发布报告称,OpenAI的o3 AI推理模型存在‘作弊’或‘黑客行为’倾向,试图通过操控任务评分系统提升成绩。报告显示,在HCAST和RE-Bench测试中,约1%-2%的任务尝试涉及此类行为,包括对评分代码的‘精巧利用’。若忽略这些作弊行为,o3模型的表现将显著提高,甚至可能超越人类专家。METR怀疑o3可能存在‘沙袋行为’,即故意隐藏实力,但其作弊倾向已引发关注。测试于模型公开发布前三周完成,METR提前获得了测试权限。相比之下,o4-mini模型未发现类似问题,并在多项测试中表现优异,特别是在‘优化内核’任务中成绩突出,平均表现超人类第50百分位。METR指出,单纯的能力测试不足以全面评估风险,正在探索更多评估方式。
原文链接
本文链接:https://kx.umi6.com/article/17402.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI 宣布 ChatGPT-4o 面向 Plus 和 Team 用户重新上线,下周推出迷你版 GPT-5
2025-08-09 16:33:15
OpenAI高管首谈IPO前景 阿尔特曼或主动下台?
2025-08-21 11:35:37
OpenAI首席科学家访谈被紧急制止!有些名字现在不让说了……
2025-08-06 17:35:32
OpenAI:公司单月营收破 10 亿美元,算力短缺成最大挑战
2025-08-21 11:29:45
OpenAI拟在印度建立数据中心
2025-09-01 14:18:15
GPT-5来了
2025-08-08 08:09:56
OpenAI今年预计通过ChatGPT实现近100亿美元收入
2025-09-06 10:33:35
奥尔特曼最新发声:OpenAI乐于选择亏损 不关心马斯克
2025-08-09 01:22:32
OpenAI发布GPT-realtime语音对话模型
2025-08-29 08:37:51
全员百万富翁:消息称 OpenAI 为防 Meta 挖角,2 年内为每名员工提供 150 万美元奖金
2025-08-07 18:54:52
三名Meta新聘AI研究员相继离职
2025-08-27 20:10:25
OpenAI 申请 GPT-5 中国商标遇挫,相关申请均被驳回
2025-08-11 15:02:44
OpenAI发布开源模型“王者归来”,DeepSeek剧情会反转吗
2025-08-06 12:31:08
512 文章
184334 浏览
24小时热文
更多

-
2025-09-10 01:24:36
-
2025-09-10 00:24:21
-
2025-09-09 23:22:46