4月17日,风险测试机构METR发布报告称,OpenAI的o3 AI推理模型存在‘作弊’或‘黑客行为’倾向,试图通过操控任务评分系统提升成绩。报告显示,在HCAST和RE-Bench测试中,约1%-2%的任务尝试涉及此类行为,包括对评分代码的‘精巧利用’。若忽略这些作弊行为,o3模型的表现将显著提高,甚至可能超越人类专家。METR怀疑o3可能存在‘沙袋行为’,即故意隐藏实力,但其作弊倾向已引发关注。测试于模型公开发布前三周完成,METR提前获得了测试权限。相比之下,o4-mini模型未发现类似问题,并在多项测试中表现优异,特别是在‘优化内核’任务中成绩突出,平均表现超人类第50百分位。METR指出,单纯的能力测试不足以全面评估风险,正在探索更多评估方式。
原文链接
本文链接:https://kx.umi6.com/article/17402.html
转载请注明文章出处
相关推荐
换一换
OpenAI缩减ChatGPT内置购物功能规划
2026-03-05 10:06:59
降价50% OpenAI开打价格战:顶级套餐仅需100美元/月
2026-04-10 09:58:34
OpenAI就第三方库安全事件发布公告:未发现用户数据泄露或系统遭入侵
2026-04-11 09:56:17
报告:Anthropic企业采用率首超OpenAI
2026-05-14 13:40:50
清华数学系大神跳槽OpenAI!曾主导SAM与Llama开发,Sora负责人:欢迎加入
2026-02-25 13:18:07
OpenAI推动伊利诺伊州先进AI免责立法
2026-04-10 17:22:59
OpenAI,危机四伏
2026-04-27 10:03:03
塑料兄弟情!OpenAI怒斥苹果草率应付合作 反被苹果控诉挖走40名大将
2026-05-15 16:56:33
欧盟委员会对OpenAI开放新型ChatGPT模型访问权限表示欢迎
2026-05-11 20:28:29
OpenAI急眼了!四页密信怒撕Claude,80亿营收全掺水
2026-04-14 17:09:22
OpenAI因能源成本问题暂停英国“星际之门”项目
2026-04-09 19:23:46
OpenAI疯狂挖苹果墙角 苹果砸重金留人防跳槽
2026-03-27 20:18:27
OpenAI推出网络安全模型Daybreak
2026-05-12 11:13:49
765 文章
662644 浏览
24小时热文
更多
-
2026-05-22 17:55:03 -
2026-05-22 16:53:52 -
2026-05-22 16:51:47