OpenAI推出创新模型CriticGPT,基于GPT-4训练,能有效检测代码错误,其在挑Bug任务中表现远超人类,达到75%以上准确率。此外,CriticGPT还能改进RLHF(人类反馈强化学习)过程,挑战人类智能上限。模型已进入OpenAI内部训练流程,且在非代码领域也展现出识别错误的能力。研究由前超级对齐团队成员Jan Leike领导,他现已转至Anthropic继续此类工作。CriticGPT展示了可扩展监督的潜力,预示着AI监督能力的提升。尽管仍存在“幻觉”问题,但与人类配合时效果最佳。OpenAI论文详细介绍了模型开发和应用,同时回应了谷歌Gemma 2的发布。这篇新闻揭示了人工智能在辅助训练和错误检测方面的最新进展。
原文链接
本文链接:https://kx.umi6.com/article/2278.html
转载请注明文章出处
相关推荐
换一换
DeepSeek的极致谄媚,正在摧毁我们的判断力
2025-04-09 23:12:38
人类打辩论不如GPT-4?!Nature子刊:900人实战演练,AI胜率64.4%,还更会说服人
2025-05-25 15:19:25
GPT-4即将“退役”
2025-04-15 11:26:27
Wanderboat AI:这个华人团队开发的AI旅行app,是大模型时代的小红书+马蜂窝?
2024-07-12 12:02:59
苹果AI版iOS抢先体验:部分任务表现超越GPT-4
2024-07-30 18:20:25
用AI监督AI,OpenAI做到了用左脚踩右脚上天
2024-07-03 09:49:52
AI可能比你更会炒股?
2024-05-30 16:02:33
GPT-4 串谋 AI“欺骗”人类:哈佛 PSU 揭秘“算法共谋”,AI 教父预言正成真
2024-11-29 15:55:39
模型训练成本“平民化”,前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2
2024-07-13 23:01:49
比GPT-4强100倍!OpenAI将在12月发布新模型—猎户座
2024-10-29 11:24:12
挑战谷歌,OpenAI 搜索引擎 SearchGPT 登场:基于 GPT-4 系列 AI 模型,初期仅邀请 1 万人测试
2024-07-26 07:30:58
扳回一局:顶级小说家全方位吊打AI,人类终于赢了
2024-07-19 20:00:47
研究:GPT-4 在预测公司盈利方面超越人类分析师
2024-05-27 16:14:18
731 文章
489566 浏览
24小时热文
更多
-
2026-03-10 13:19:24 -
2026-03-10 13:18:55 -
2026-03-10 12:13:43