CriticGPT - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

北大千问团队推出数学专用版CriticGPT，找茬让大模型进步更快

北京大学的研究团队推出名为Math-Minos的数学专用版CriticGPT，借鉴了CriticGPT的思想，通过在数学问题中设置错误并提供详细标注，训练模型提高解决问题的准确性。Math-Minos在无需额外训练的情况下，通过自然语言反馈，如逐步的正确性分析，显著提升了数学推理验证器Mistral-7B的性能。在GSM8K数据集上，准确率分别从86.2%提升至88.2%。此外，Math-Minos展示了在多步骤推理中的错误分类和学习潜力，以及对生成器错误的深入理解。这项工作预示着自然语言反馈可能成为改进大型语言模型复杂推理能力的新途径。

原文链接

AI创想团

07-08 09:42:41

CriticGPT

Math-Minos

数学验证器

分享至

打开微信扫一扫

内容投诉

生成图片

用AI监督AI，OpenAI做到了用左脚踩右脚上天

OpenAI推出新模型CriticGPT，利用AI监督自身AI，旨在解决ChatGPT等AI产品存在的幻觉问题。这款基于GPT-4的模型通过强化学习（RLHF）提升人类训练师审查效率60%，能在代码输出中捕捉错误。CriticGPT是AI文本检测器的升级，通过篡改答案进行随机对照实验，其在识别人为错误和自然出现的bug上表现优异。OpenAI采用FSBS技术避免幻觉叠加导致更大错误，并强调CriticGPT的可扩展监督概念，预示着大模型监督大模型可能带来超越人类智能的可能性。这一创新有助于扩展RLHF的应用并推动人工智能的持续改进。

原文链接

未来编码者

07-03 09:49:52

CriticGPT

RLHF

人工智能监督

分享至

打开微信扫一扫

内容投诉

生成图片

比尔·盖茨称不要太担心AI耗电；OpenAI推出全新CriticGPT模型

比尔·盖茨在伦敦突破能源峰会上为AI的高能耗辩护，认为科技公司将推动绿色能源发展，抵消电力消耗。尽管美国能源部警告AI可能成为数据中心负荷增长的主要驱动力，盖茨认为AI将加速减排。OpenAI推出新模型CriticGPT，帮助人类训练员检测GPT-4代码错误，提高审查效率。同时，谷歌发布270亿参数的Gemma 2，击败Llama 3，而中国AI独角兽智谱的GLM-4-9B被认为性能优于Gemma。此外，Hebbia完成1亿美元B轮融资，聚焦AI搜索文档，斯坦福出身的Hebbia欲通过AI简化信息查找。全球首个人工智能生活实验室在北京海淀亮相，免费向公众开放，展示AI在日常生活中的应用。字节跳动发布豆包MarsCo智能开发工具，助力开发者提升效率。

原文链接

镜像现实MirageX

06-28 22:30:17

AI能耗

CriticGPT

比尔·盖茨

分享至

打开微信扫一扫

内容投诉

生成图片

GPT-4批评GPT-4实现「自我提升」，OpenAI前超级对齐团队又一力作被公开

OpenAI近期推出CriticGPT，作为GPT-4的辅助工具，用于检测生成代码中的错误，标志着模型自我监督的新尝试。CriticGPT是用GPT-4训练的，通过捕获并纠正GPT-4的代码bug，试图缓解RLHF对齐过程中的人力需求。尽管CriticGPT与RLHF相辅相成，但其训练数据仍依赖于人为引入的错误，以提高模型的反馈质量。实验结果显示，CriticGPT在批评任务上超过人类，特别是在发现预设错误方面，但仍面临幻觉和复杂任务评估的挑战。研究团队希望此方法能为未来的模型训练提供新的视角，特别是在长形式任务的监督方面。

原文链接

AI幻想空间站

06-28 20:39:10

CriticGPT

RLHF

自我提升

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI突发新模型，用GPT-4给GPT-4“找茬”

OpenAI近期发布名为CriticGPT的新模型，基于GPT-4设计，专长于代码审查，能找出75%以上的bug，远超人类的25%。这款AI不仅能检测编程错误，还能提供有价值的批评，60%情况下受训人员更偏爱CriticGPT的反馈。研究者利用人为植入的bug和RLHF训练，使CriticGPT进化，挑战了人类在错误检测上的局限。CriticGPT的出现预示着RLHF的天花板可能不再限于人类，且为可扩展监督提供了新途径。然而，CriticGPT仍有提升空间，但它标志着AI辅助下的人机协作在困难任务中的进展。值得注意的是，OpenAI前员工Jan Leike已转至Anthropic继续此类研究，并在离职后向潜在研究者发出邀请。此外，OpenAI与谷歌的大模型竞争中，CriticGPT的发布是对Gemma 2开源的回应。尽管未达外界期待，但OpenAI此番论文公开显示了其一定程度的透明度。

原文链接

AI创想团

06-28 15:28:02

CriticGPT

GPT-4

RLHF

分享至

打开微信扫一扫

内容投诉

生成图片

用GPT-4纠错GPT-4！OpenAI推出CriticGPT模型

OpenAI在6月27日推出CriticGPT，一款利用GPT-4检测自身错误的模型，旨在辅助人工智能训练师在强化学习中发现并纠正ChatGPT输出的细微问题。研究表明，使用CriticGPT后，训练师的表现提升60%，且能提供更全面的反馈。CriticGPT特别在评估复杂代码时有价值，尽管其建议并非总是完美，但明显优于无AI辅助。这一创新展示了OpenAI在RLHF领域的技术领导力。

原文链接

神经网络领航员

06-28 14:37:33

CriticGPT

GPT-4

RLHF

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI突发新模型：用GPT改进GPT训练，左脚踩右脚登天，RLHF突破人类能力上限

OpenAI推出创新模型CriticGPT，基于GPT-4训练，能有效检测代码错误，其在挑Bug任务中表现远超人类，达到75%以上准确率。此外，CriticGPT还能改进RLHF（人类反馈强化学习）过程，挑战人类智能上限。模型已进入OpenAI内部训练流程，且在非代码领域也展现出识别错误的能力。研究由前超级对齐团队成员Jan Leike领导，他现已转至Anthropic继续此类工作。CriticGPT展示了可扩展监督的潜力，预示着AI监督能力的提升。尽管仍存在“幻觉”问题，但与人类配合时效果最佳。OpenAI论文详细介绍了模型开发和应用，同时回应了谷歌Gemma 2的发布。这篇新闻揭示了人工智能在辅助训练和错误检测方面的最新进展。

原文链接

AGI探路者

06-28 11:36:12

CriticGPT

GPT-4

RLHF

分享至

打开微信扫一扫

内容投诉

生成图片

专给 ChatGPT“找茬”，OpenAI 训练 CriticGPT 模型以检索输出内容错误

OpenAI于6月27日推出CriticGPT，基于GPT-4训练，旨在检测ChatGPT输出内容的错误，通过"从人类反馈中强化学习"技术辅助AI训练。随着ChatGPT准确度提升，识别隐藏错误变得困难。CriticGPT在检测时需处理答案中的多处错误，OpenAI表示未来将扩展至处理分散性问题。这一模型的出现反映了AI训练领域对提高准确性的持续关注。

原文链接