4月7日消息,谷歌联合卡内基梅隆大学和MultiOn的研究团队发现,合成数据可使大模型数学推理能力提升八倍。当前全球高质量文本训练标记约300万亿个,但随着大模型需求激增,预计2026年前将耗尽这些数据,合成数据成为关键替代方案。研究团队探索了正向数据(正确解题示例)与负向数据(错误解题步骤)两种类型。正向数据虽能提供解题参考,但可能导致模型过度依赖模式匹配而非深入理解。负向数据则通过直接偏好优化(DPO)方法帮助模型识别并修正错误,增强逻辑推理能力。DPO为每一步骤分配优势值,强调关键步骤价值。测试显示,结合正向和负向合成数据预训练后,DeepSeek-Math-7B和LLaMa2-7B等模型在GSM8K和MATH数据集上的数学推理性能显著提升八倍,展现了合成数据的巨大潜力。
原文链接
本文链接:https://kx.umi6.com/article/16764.html
转载请注明文章出处
相关推荐
换一换
宇树科技王兴兴:谁能把机器人用的大模型做出来 谁就是全世界最厉害的AI公司和机器人公司
2026-01-30 12:25:48
花3000元让AI改口,大模型的尽头是广告?
2026-01-06 19:29:29
腾讯AI下了一场「及时雨」
2025-12-19 10:42:16
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026
2025-12-22 10:34:39
我国大模型密集落地 新技术加速普惠应用
2026-02-14 12:17:30
智谱AI今日正式上市,一文讲透你想知道的6件事
2026-01-09 21:35:10
腾讯宣布升级大模型研发架构 前OpenAI研究员姚顺雨任要职
2025-12-17 17:58:49
中国AI云,开始「抢座次」了
2025-11-20 11:17:00
OpenAI的命门,决定了大模型公司的未来
2025-09-03 14:48:12
华人AI大神霸气离职,一篇博客挑明中美大模型暗战
2025-10-11 10:14:30
全球大模型第一股要来了 智谱发布IPO招股书:代码能力并列全球第一
2025-12-19 23:17:39
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式
2025-12-16 10:32:22
阿里千问大模型换将,32岁林俊旸官宣告别
2026-03-04 10:27:38
648 文章
442325 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18