
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
北京大学的研究团队推出名为Math-Minos的数学专用版CriticGPT,借鉴了CriticGPT的思想,通过在数学问题中设置错误并提供详细标注,训练模型提高解决问题的准确性。Math-Minos在无需额外训练的情况下,通过自然语言反馈,如逐步的正确性分析,显著提升了数学推理验证器Mistral-7B的性能。在GSM8K数据集上,准确率分别从86.2%提升至88.2%。此外,Math-Minos展示了在多步骤推理中的错误分类和学习潜力,以及对生成器错误的深入理解。这项工作预示着自然语言反馈可能成为改进大型语言模型复杂推理能力的新途径。
原文链接
加载更多

暂无内容