OpenAI推出创新模型CriticGPT,基于GPT-4训练,能有效检测代码错误,其在挑Bug任务中表现远超人类,达到75%以上准确率。此外,CriticGPT还能改进RLHF(人类反馈强化学习)过程,挑战人类智能上限。模型已进入OpenAI内部训练流程,且在非代码领域也展现出识别错误的能力。研究由前超级对齐团队成员Jan Leike领导,他现已转至Anthropic继续此类工作。CriticGPT展示了可扩展监督的潜力,预示着AI监督能力的提升。尽管仍存在“幻觉”问题,但与人类配合时效果最佳。OpenAI论文详细介绍了模型开发和应用,同时回应了谷歌Gemma 2的发布。这篇新闻揭示了人工智能在辅助训练和错误检测方面的最新进展。
原文链接
本文链接:https://kx.umi6.com/article/2278.html
转载请注明文章出处
相关推荐
换一换
OpenAI被曝自研人形机器人,4年前因缺数据解散团队
2024-12-25 18:11:23
AI可能比你更会炒股?最新研究:GPT-4比人类更擅长金融分析和预测
2024-05-29 14:54:08
周鸿祎ISC发布国内首个免费安全大模型 安全能力超越GPT-4
2024-08-01 17:47:58
科大讯飞:讯飞星火 V4.0 正在训练中,对标 GPT-4o 的产品也在研发
2024-06-02 17:40:49
人类打辩论不如GPT-4?!Nature子刊:900人实战演练,AI胜率64.4%,还更会说服人
2025-05-25 15:19:25
GPT-4欺骗人类高达99.16%惊人率,PNAS重磅研究曝出,LLM推理越强欺骗值越高
2024-06-11 08:39:03
“ChatGPT之母”:人工智能对经济的影响才刚刚开始
2024-05-30 18:04:48
重磅消息传来,通过测试了,74年来最高,54%的参与者误认为它是真人
2024-06-21 08:19:03
DeepSeek的极致谄媚,正在摧毁我们的判断力
2025-04-09 23:12:38
永别了,GPT-4
2025-04-12 13:47:11
北大千问团队推出数学专用版CriticGPT,找茬让大模型进步更快
2024-07-08 09:42:41
谷歌打擂OpenAI:Gemini Live和GPT-4o谁能更胜一筹?
2024-05-24 16:15:01
研究称GPT-4通过图灵测试
2024-06-20 18:25:47
597 文章
260806 浏览
24小时热文
更多
-
2025-10-24 19:49:44 -
2025-10-24 18:49:31 -
2025-10-24 18:49:20