4月7日消息,谷歌联合卡内基梅隆大学和MultiOn的研究团队发现,合成数据可使大模型数学推理能力提升八倍。当前全球高质量文本训练标记约300万亿个,但随着大模型需求激增,预计2026年前将耗尽这些数据,合成数据成为关键替代方案。研究团队探索了正向数据(正确解题示例)与负向数据(错误解题步骤)两种类型。正向数据虽能提供解题参考,但可能导致模型过度依赖模式匹配而非深入理解。负向数据则通过直接偏好优化(DPO)方法帮助模型识别并修正错误,增强逻辑推理能力。DPO为每一步骤分配优势值,强调关键步骤价值。测试显示,结合正向和负向合成数据预训练后,DeepSeek-Math-7B和LLaMa2-7B等模型在GSM8K和MATH数据集上的数学推理性能显著提升八倍,展现了合成数据的巨大潜力。
原文链接
本文链接:https://kx.umi6.com/article/16764.html
转载请注明文章出处
相关推荐
换一换
马年4大顶流模型会师阿里云Coding Plan开工!Token量大管饱,自由切换真香
2026-02-26 00:01:12
大厂AI新战场:AQ狂飙,蚂蚁押注大健康赛道
2025-11-09 16:34:57
张亚勤谈大模型的未来:全球不超10个 且中美将各占三四个
2026-03-18 11:06:09
两部门:到2027年推动五个以上专业大模型在电网、发电、煤炭、油气等行业深度应用
2025-09-08 10:56:26
国产模型+国产芯片“蜜月期”开启!DeepSeek、智谱密集上新 华为、寒武纪芯片火速适配
2025-09-30 21:35:35
阶跃星辰杀入季后赛,强势跻身AI“新六小虎”第一梯队
2026-02-27 15:48:37
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026
2025-12-21 10:35:20
杨植麟当主持人的大模型圆桌:张鹏罗福莉夏立雪都放开说了
2026-03-27 23:23:11
Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5
2026-01-20 22:33:50
啊?微博7800美元训的大模型,数学能力超了DeepSeek-R1
2025-11-18 14:20:39
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
腾讯AI下了一场「及时雨」
2025-12-19 10:42:16
中国中文信息学会2025学术年会暨第二届中国大模型大会(CIPS & CLM 2025)于10月28日在北京盛大开幕
2025-10-30 18:52:50
682 文章
525299 浏览
24小时热文
更多
-
2026-04-24 17:27:38 -
2026-04-24 17:26:33 -
2026-04-24 17:25:23