OpenAI近期发布名为CriticGPT的新模型,基于GPT-4设计,专长于代码审查,能找出75%以上的bug,远超人类的25%。这款AI不仅能检测编程错误,还能提供有价值的批评,60%情况下受训人员更偏爱CriticGPT的反馈。研究者利用人为植入的bug和RLHF训练,使CriticGPT进化,挑战了人类在错误检测上的局限。CriticGPT的出现预示着RLHF的天花板可能不再限于人类,且为可扩展监督提供了新途径。然而,CriticGPT仍有提升空间,但它标志着AI辅助下的人机协作在困难任务中的进展。值得注意的是,OpenAI前员工Jan Leike已转至Anthropic继续此类研究,并在离职后向潜在研究者发出邀请。此外,OpenAI与谷歌的大模型竞争中,CriticGPT的发布是对Gemma 2开源的回应。尽管未达外界期待,但OpenAI此番论文公开显示了其一定程度的透明度。
原文链接
本文链接:https://kx.umi6.com/article/2299.html
转载请注明文章出处
相关推荐
.png)
换一换
“ChatGPT之母”:人工智能对经济的影响才刚刚开始
2024-05-30 18:04:48
研究:GPT-4 在预测公司盈利方面超越人类分析师
2024-05-27 16:14:18
重磅消息传来,通过测试了,74年来最高,54%的参与者误认为它是真人
2024-06-21 08:19:03
OpenAI首席技术官:预计几年内“博士级智能”的AI就会出现
2024-06-21 19:34:02
谷歌打擂OpenAI:Gemini Live和GPT-4o谁能更胜一筹?
2024-05-24 16:15:01
Wanderboat AI:这个华人团队开发的AI旅行app,是大模型时代的小红书+马蜂窝?
2024-07-12 12:02:59
GPT-4顶替大学生参加考试,94%作弊未被揭穿,AI作弊毫无破绽
2024-06-27 22:51:41
北大千问团队推出数学专用版CriticGPT,找茬让大模型进步更快
2024-07-08 09:42:41
万轮实测:GPT-4.5不如GPT-4
2025-02-28 21:30:01
持平GPT-4o,毒舌属性拉满,Gork-2是吃了一个马斯克吧
2024-08-16 00:17:34
Mac版ChatGPT上线,GPT-4语音功能推迟
2024-06-26 14:00:53
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
2025-03-12 14:26:26
OpenAI被曝自研人形机器人,4年前因缺数据解散团队
2024-12-25 18:11:23
505 文章
166588 浏览
24小时热文
更多

-
2025-09-06 23:39:46
-
2025-09-06 22:39:24
-
2025-09-06 21:38:26