OpenAI近期发布名为CriticGPT的新模型,基于GPT-4设计,专长于代码审查,能找出75%以上的bug,远超人类的25%。这款AI不仅能检测编程错误,还能提供有价值的批评,60%情况下受训人员更偏爱CriticGPT的反馈。研究者利用人为植入的bug和RLHF训练,使CriticGPT进化,挑战了人类在错误检测上的局限。CriticGPT的出现预示着RLHF的天花板可能不再限于人类,且为可扩展监督提供了新途径。然而,CriticGPT仍有提升空间,但它标志着AI辅助下的人机协作在困难任务中的进展。值得注意的是,OpenAI前员工Jan Leike已转至Anthropic继续此类研究,并在离职后向潜在研究者发出邀请。此外,OpenAI与谷歌的大模型竞争中,CriticGPT的发布是对Gemma 2开源的回应。尽管未达外界期待,但OpenAI此番论文公开显示了其一定程度的透明度。
原文链接
本文链接:https://kx.umi6.com/article/2299.html
转载请注明文章出处
相关推荐
换一换
人类打辩论不如GPT-4?!Nature子刊:900人实战演练,AI胜率64.4%,还更会说服人
2025-05-25 15:19:25
“ChatGPT之母”:人工智能对经济的影响才刚刚开始
2024-05-30 18:04:48
OpenAI突发新模型,用GPT-4给GPT-4“找茬”
2024-06-28 15:28:02
GPT-4欺骗人类高达99.16%惊人率,PNAS重磅研究曝出,LLM推理越强欺骗值越高
2024-06-11 08:39:03
Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想
2024-06-07 16:37:36
谁卡了OpenAI的脖子?
2024-07-03 14:32:20
OpenAI:GPT-4本月底退役 由4o完全替代
2025-04-12 22:05:46
ChatGPT有望年底发布下一代模型 比GPT-4强100倍
2024-09-05 15:27:26
AI可能比你更会炒股?最新研究:GPT-4比人类更擅长金融分析和预测
2024-05-29 14:54:08
持平GPT-4o,毒舌属性拉满,Gork-2是吃了一个马斯克吧
2024-08-16 00:17:34
OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!
2024-06-07 20:15:45
重磅消息传来,通过测试了,74年来最高,54%的参与者误认为它是真人
2024-06-21 08:19:03
AI可能比你更会炒股?
2024-05-30 16:02:33
690 文章
483594 浏览
24小时热文
更多
-
2026-03-10 13:19:24 -
2026-03-10 13:18:55 -
2026-03-10 12:13:43