OpenAI推出创新模型CriticGPT,基于GPT-4训练,能有效检测代码错误,其在挑Bug任务中表现远超人类,达到75%以上准确率。此外,CriticGPT还能改进RLHF(人类反馈强化学习)过程,挑战人类智能上限。模型已进入OpenAI内部训练流程,且在非代码领域也展现出识别错误的能力。研究由前超级对齐团队成员Jan Leike领导,他现已转至Anthropic继续此类工作。CriticGPT展示了可扩展监督的潜力,预示着AI监督能力的提升。尽管仍存在“幻觉”问题,但与人类配合时效果最佳。OpenAI论文详细介绍了模型开发和应用,同时回应了谷歌Gemma 2的发布。这篇新闻揭示了人工智能在辅助训练和错误检测方面的最新进展。
原文链接
本文链接:https://kx.umi6.com/article/2278.html
转载请注明文章出处
相关推荐
换一换
OpenAI首席技术官:预计几年内“博士级智能”的AI就会出现
2024-06-21 19:34:02
GPT-4私教辅导6周=在校上课2年,新研究:AI辅助越多进步越明显
2025-01-16 16:56:45
OpenAI 把 GPT-4 原始版给了瑞士洛桑联邦理工团队:研究不微调只靠提示词能走多远
2024-06-03 18:57:18
AI可能比你更会炒股?
2024-05-30 16:02:33
人类打辩论不如GPT-4?!Nature子刊:900人实战演练,AI胜率64.4%,还更会说服人
2025-05-25 15:19:25
持平GPT-4o,毒舌属性拉满,Gork-2是吃了一个马斯克吧
2024-08-16 00:17:34
成功率达 53%,研究显示 GPT-4 可自主利用“零日”漏洞攻破网站
2024-06-09 14:05:27
Wanderboat AI:这个华人团队开发的AI旅行app,是大模型时代的小红书+马蜂窝?
2024-07-12 12:02:59
OpenAI公开破解GPT-4思维的新方法,Ilya也参与了
2024-06-07 20:51:33
GPT-4批评GPT-4实现「自我提升」,OpenAI前超级对齐团队又一力作被公开
2024-06-28 20:39:10
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
2025-03-12 14:26:26
北大千问团队推出数学专用版CriticGPT,找茬让大模型进步更快
2024-07-08 09:42:41
GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示
2024-05-27 18:08:59
644 文章
356421 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57