4月7日消息,谷歌联合卡内基梅隆大学和MultiOn的研究团队发现,合成数据可使大模型数学推理能力提升八倍。当前全球高质量文本训练标记约300万亿个,但随着大模型需求激增,预计2026年前将耗尽这些数据,合成数据成为关键替代方案。研究团队探索了正向数据(正确解题示例)与负向数据(错误解题步骤)两种类型。正向数据虽能提供解题参考,但可能导致模型过度依赖模式匹配而非深入理解。负向数据则通过直接偏好优化(DPO)方法帮助模型识别并修正错误,增强逻辑推理能力。DPO为每一步骤分配优势值,强调关键步骤价值。测试显示,结合正向和负向合成数据预训练后,DeepSeek-Math-7B和LLaMa2-7B等模型在GSM8K和MATH数据集上的数学推理性能显著提升八倍,展现了合成数据的巨大潜力。
原文链接
本文链接:https://kx.umi6.com/article/16764.html
转载请注明文章出处
相关推荐
换一换
当AI智能体走进诊室,大模型如何颠覆医疗?
2025-07-30 13:48:25
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
三家混战,大模型重回2023
2025-08-03 11:35:50
IDC评测9家座舱大模型产品 斑马获最多项满分推荐
2025-07-18 11:36:59
我国大模型数量居全球首位
2025-07-27 13:58:52
高性能计算群星闪耀时
2025-08-21 12:35:24
国产模型+国产芯片“蜜月期”开启!DeepSeek、智谱密集上新 华为、寒武纪芯片火速适配
2025-09-30 21:35:35
消息称小米研发智能问答助手产品“Mi Chat”
2025-12-09 17:51:08
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
2025-08-11 10:59:04
大模型产生幻觉,全怪人类PUA吗?
2025-09-10 15:36:03
GPT-5 没有惊喜,但信号拉满
2025-08-11 13:00:45
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
大模型激战正酣!大厂节前、节中进展不停 争夺下一代操作系统主导权
2025-10-05 18:23:27
578 文章
324149 浏览
24小时热文
更多
-
2025-12-10 08:35:53 -
2025-12-10 08:34:53 -
2025-12-10 08:33:46