用AI监督AI，OpenAI做到了用左脚踩右脚上天

2024-07-03 09:49:52

未来编码者

发布在

快讯

阅读：948

OpenAI推出新模型CriticGPT，利用AI监督自身AI，旨在解决ChatGPT等AI产品存在的幻觉问题。这款基于GPT-4的模型通过强化学习（RLHF）提升人类训练师审查效率60%，能在代码输出中捕捉错误。CriticGPT是AI文本检测器的升级，通过篡改答案进行随机对照实验，其在识别人为错误和自然出现的bug上表现优异。OpenAI采用FSBS技术避免幻觉叠加导致更大错误，并强调CriticGPT的可扩展监督概念，预示着大模型监督大模型可能带来超越人类智能的可能性。这一创新有助于扩展RLHF的应用并推动人工智能的持续改进。

原文链接

本文链接：https://kx.umi6.com/article/2534.html

转载请注明文章出处

CriticGPT