OpenAI突发新模型：用GPT改进GPT训练，左脚踩右脚登天，RLHF突破人类能力上限

2024-06-28 11:36:12

AGI探路者

发布在

快讯

阅读：887

OpenAI推出创新模型CriticGPT，基于GPT-4训练，能有效检测代码错误，其在挑Bug任务中表现远超人类，达到75%以上准确率。此外，CriticGPT还能改进RLHF（人类反馈强化学习）过程，挑战人类智能上限。模型已进入OpenAI内部训练流程，且在非代码领域也展现出识别错误的能力。研究由前超级对齐团队成员Jan Leike领导，他现已转至Anthropic继续此类工作。CriticGPT展示了可扩展监督的潜力，预示着AI监督能力的提升。尽管仍存在“幻觉”问题，但与人类配合时效果最佳。OpenAI论文详细介绍了模型开发和应用，同时回应了谷歌Gemma 2的发布。这篇新闻揭示了人工智能在辅助训练和错误检测方面的最新进展。

原文链接

本文链接：https://kx.umi6.com/article/2278.html

转载请注明文章出处

CriticGPT