OpenAI近期发布名为CriticGPT的新模型,基于GPT-4设计,专长于代码审查,能找出75%以上的bug,远超人类的25%。这款AI不仅能检测编程错误,还能提供有价值的批评,60%情况下受训人员更偏爱CriticGPT的反馈。研究者利用人为植入的bug和RLHF训练,使CriticGPT进化,挑战了人类在错误检测上的局限。CriticGPT的出现预示着RLHF的天花板可能不再限于人类,且为可扩展监督提供了新途径。然而,CriticGPT仍有提升空间,但它标志着AI辅助下的人机协作在困难任务中的进展。值得注意的是,OpenAI前员工Jan Leike已转至Anthropic继续此类研究,并在离职后向潜在研究者发出邀请。此外,OpenAI与谷歌的大模型竞争中,CriticGPT的发布是对Gemma 2开源的回应。尽管未达外界期待,但OpenAI此番论文公开显示了其一定程度的透明度。
原文链接
本文链接:https://kx.umi6.com/article/2299.html
转载请注明文章出处
相关推荐
换一换
万轮实测:GPT-4.5不如GPT-4
2025-02-28 21:30:01
用GPT-4纠错GPT-4!OpenAI推出CriticGPT模型
2024-06-28 14:37:33
Wanderboat AI:这个华人团队开发的AI旅行app,是大模型时代的小红书+马蜂窝?
2024-07-12 12:02:59
谷歌打擂OpenAI:Gemini Live和GPT-4o谁能更胜一筹?
2024-05-24 16:15:01
人类打辩论不如GPT-4?!Nature子刊:900人实战演练,AI胜率64.4%,还更会说服人
2025-05-25 15:19:25
OpenAI:GPT-4本月底退役 由4o完全替代
2025-04-12 22:05:46
专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误
2024-06-28 08:14:34
Mac版ChatGPT上线,GPT-4语音功能推迟
2024-06-26 14:00:53
GPT-4即将“退役”!OpenAI宣布本月末起它将被GPT-4o替代
2025-04-14 16:42:54
比尔·盖茨称不要太担心AI耗电;OpenAI推出全新CriticGPT模型
2024-06-28 22:30:17
OpenAI 推出为大学开发的 ChatGPT Edu 教育版,对话和数据不用于训练模型
2024-05-31 12:13:07
成功率达 53%,研究显示 GPT-4 可自主利用“零日”漏洞攻破网站
2024-06-09 14:05:27
微软开启 AI 办公新时代:Microsoft 365 Copilot Chat 更名上线
2025-01-16 10:53:32
614 文章
356074 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57