OpenAI推出新模型CriticGPT,利用AI监督自身AI,旨在解决ChatGPT等AI产品存在的幻觉问题。这款基于GPT-4的模型通过强化学习(RLHF)提升人类训练师审查效率60%,能在代码输出中捕捉错误。CriticGPT是AI文本检测器的升级,通过篡改答案进行随机对照实验,其在识别人为错误和自然出现的bug上表现优异。OpenAI采用FSBS技术避免幻觉叠加导致更大错误,并强调CriticGPT的可扩展监督概念,预示着大模型监督大模型可能带来超越人类智能的可能性。这一创新有助于扩展RLHF的应用并推动人工智能的持续改进。
原文链接
本文链接:https://kx.umi6.com/article/2534.html
转载请注明文章出处
相关推荐
.png)
换一换
用AI监督AI,OpenAI做到了用左脚踩右脚上天
2024-07-03 09:49:52
用GPT-4纠错GPT-4!OpenAI推出CriticGPT模型
2024-06-28 14:37:33
GPT-4批评GPT-4实现「自我提升」,OpenAI前超级对齐团队又一力作被公开
2024-06-28 20:39:10
OpenAI突发新模型,用GPT-4给GPT-4“找茬”
2024-06-28 15:28:02
北大千问团队推出数学专用版CriticGPT,找茬让大模型进步更快
2024-07-08 09:42:41
专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误
2024-06-28 08:14:34
OpenAI被曝自研人形机器人,4年前因缺数据解散团队
2024-12-25 18:11:23
OpenAI突发新模型:用GPT改进GPT训练,左脚踩右脚登天,RLHF突破人类能力上限
2024-06-28 11:36:12
DeepSeek的极致谄媚,正在摧毁我们的判断力
2025-04-09 23:12:38
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
2025-03-12 14:26:26
比尔·盖茨称不要太担心AI耗电;OpenAI推出全新CriticGPT模型
2024-06-28 22:30:17
DeepSeek被曝开发AI智能体模型:能自主完成多步工作
2025-09-05 08:15:12
9.16-9.17来腾讯全球数字生态大会,与行业大咖「智者见智」共话AI增益新机
2025-09-04 20:06:13
536 文章
192703 浏览
24小时热文
更多

-
2025-09-06 23:39:46
-
2025-09-06 22:39:24
-
2025-09-06 21:38:26