4月7日消息,谷歌联合卡内基梅隆大学和MultiOn的研究团队发现,合成数据可使大模型数学推理能力提升八倍。当前全球高质量文本训练标记约300万亿个,但随着大模型需求激增,预计2026年前将耗尽这些数据,合成数据成为关键替代方案。研究团队探索了正向数据(正确解题示例)与负向数据(错误解题步骤)两种类型。正向数据虽能提供解题参考,但可能导致模型过度依赖模式匹配而非深入理解。负向数据则通过直接偏好优化(DPO)方法帮助模型识别并修正错误,增强逻辑推理能力。DPO为每一步骤分配优势值,强调关键步骤价值。测试显示,结合正向和负向合成数据预训练后,DeepSeek-Math-7B和LLaMa2-7B等模型在GSM8K和MATH数据集上的数学推理性能显著提升八倍,展现了合成数据的巨大潜力。
原文链接
本文链接:https://kx.umi6.com/article/16764.html
转载请注明文章出处
相关推荐
.png)
换一换
阿联酋发布两款AI大模型 聚焦阿拉伯语和轻量化应用市场
2025-05-22 13:31:48
从黑箱到显微镜:大模型可解释性的现状与未来
2025-06-17 18:41:56
企业管理软件是不是和AI无关?
2025-06-23 13:23:28
427 文章
61098 浏览
24小时热文
更多

-
2025-07-20 09:01:50
-
2025-07-20 08:01:35
-
2025-07-19 22:57:32