1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

OpenAI近期发布名为CriticGPT的新模型,基于GPT-4设计,专长于代码审查,能找出75%以上的bug,远超人类的25%。这款AI不仅能检测编程错误,还能提供有价值的批评,60%情况下受训人员更偏爱CriticGPT的反馈。研究者利用人为植入的bug和RLHF训练,使CriticGPT进化,挑战了人类在错误检测上的局限。CriticGPT的出现预示着RLHF的天花板可能不再限于人类,且为可扩展监督提供了新途径。然而,CriticGPT仍有提升空间,但它标志着AI辅助下的人机协作在困难任务中的进展。值得注意的是,OpenAI前员工Jan Leike已转至Anthropic继续此类研究,并在离职后向潜在研究者发出邀请。此外,OpenAI与谷歌的大模型竞争中,CriticGPT的发布是对Gemma 2开源的回应。尽管未达外界期待,但OpenAI此番论文公开显示了其一定程度的透明度。

原文链接
本文链接:https://kx.umi6.com/article/2299.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误
2024-06-28 08:14:34
芝大论文证明 GPT-4 选股准确率高达 60%,人类股票分析师要下岗?AI 大牛质疑数据污染
2024-05-27 13:11:29
模型训练成本“平民化”,前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2
2024-07-13 23:01:49
GPT-4不是世界模型,LeCun双手赞同,ACL力证LLM永远无法模拟世界
2024-06-17 09:33:33
OpenAI 把 GPT-4 原始版给了瑞士洛桑联邦理工团队:研究不微调只靠提示词能走多远
2024-06-03 18:57:18
谁卡了OpenAI的脖子?
2024-07-03 14:32:20
GPT-4批评GPT-4实现「自我提升」,OpenAI前超级对齐团队又一力作被公开
2024-06-28 20:39:10
科大讯飞:讯飞星火 V4.0 正在训练中,对标 GPT-4o 的产品也在研发
2024-06-02 17:40:49
Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想
2024-06-07 16:37:36
用GPT-4纠错GPT-4!OpenAI推出CriticGPT模型
2024-06-28 14:37:33
OpenAI被曝自研人形机器人,4年前因缺数据解散团队
2024-12-25 18:11:23
万轮实测:GPT-4.5不如GPT-4
2025-02-28 21:30:01
GPT-4私教辅导6周=在校上课2年,新研究:AI辅助越多进步越明显
2025-01-16 16:56:45
24小时热文
更多
扫一扫体验小程序