OpenAI近期发布名为CriticGPT的新模型,基于GPT-4设计,专长于代码审查,能找出75%以上的bug,远超人类的25%。这款AI不仅能检测编程错误,还能提供有价值的批评,60%情况下受训人员更偏爱CriticGPT的反馈。研究者利用人为植入的bug和RLHF训练,使CriticGPT进化,挑战了人类在错误检测上的局限。CriticGPT的出现预示着RLHF的天花板可能不再限于人类,且为可扩展监督提供了新途径。然而,CriticGPT仍有提升空间,但它标志着AI辅助下的人机协作在困难任务中的进展。值得注意的是,OpenAI前员工Jan Leike已转至Anthropic继续此类研究,并在离职后向潜在研究者发出邀请。此外,OpenAI与谷歌的大模型竞争中,CriticGPT的发布是对Gemma 2开源的回应。尽管未达外界期待,但OpenAI此番论文公开显示了其一定程度的透明度。
原文链接
本文链接:https://kx.umi6.com/article/2299.html
转载请注明文章出处
相关推荐
换一换
扳回一局:顶级小说家全方位吊打AI,人类终于赢了
2024-07-19 20:00:47
成功率达 53%,研究显示 GPT-4 可自主利用“零日”漏洞攻破网站
2024-06-09 14:05:27
OpenAI突发新模型,用GPT-4给GPT-4“找茬”
2024-06-28 15:28:02
“ChatGPT之母”:人工智能对经济的影响才刚刚开始
2024-05-30 18:04:48
挑战谷歌,OpenAI 搜索引擎 SearchGPT 登场:基于 GPT-4 系列 AI 模型,初期仅邀请 1 万人测试
2024-07-26 07:30:58
持平GPT-4o,毒舌属性拉满,Gork-2是吃了一个马斯克吧
2024-08-16 00:17:34
研究称GPT-4通过图灵测试
2024-06-20 18:25:47
Mac版ChatGPT上线,GPT-4语音功能推迟
2024-06-26 14:00:53
潞晨尤洋:视频生成的GPT-4时刻,3年后可以见证 | MEET 2025
2025-01-03 15:44:15
起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
2024-08-02 14:54:04
比GPT-4强100倍!OpenAI将在12月发布新模型—猎户座
2024-10-29 11:24:12
GPT-4即将“退役”
2025-04-15 11:26:27
谷歌打擂OpenAI:Gemini Live和GPT-4o谁能更胜一筹?
2024-05-24 16:15:01
659 文章
430352 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55