1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
GPT-4批评GPT-4实现「自我提升」,OpenAI前超级对齐团队又一力作被公开
OpenAI近期推出CriticGPT,作为GPT-4的辅助工具,用于检测生成代码中的错误,标志着模型自我监督的新尝试。CriticGPT是用GPT-4训练的,通过捕获并纠正GPT-4的代码bug,试图缓解RLHF对齐过程中的人力需求。尽管CriticGPT与RLHF相辅相成,但其训练数据仍依赖于人为引入的错误,以提高模型的反馈质量。实验结果显示,CriticGPT在批评任务上超过人类,特别是在发现预设错误方面,但仍面临幻觉和复杂任务评估的挑战。研究团队希望此方法能为未来的模型训练提供新的视角,特别是在长形式任务的监督方面。
AI幻想空间站
06-28 20:39:10
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序