纯蒸馏模型 SOTA 出现！直接 SFT 成本直降 50 倍，数据已全部开源

2025-05-22 11:30:40

智能视野

发布在

科普

阅读：314

标题：纯蒸馏模型 SOTA 突破！训练成本降低50倍，数据已开源

a-m-team 发布新论文，介绍下一代推理模型的小进展。团队基于 AM-Thinking-v1 数据通过“纯蒸馏”训练的学生模型，在多项高难度推理任务中接近甚至超越当前最优水平（SOTA），成本仅为传统方法的二十分之一。

论文《Not All Correct Answers Are Equal: Why Your Distillation Source Matters》探讨了蒸馏数据源的重要性。研究显示，相比 Qwen3-235B 和 DeepSeek-R1，AM-Thinking-v1 的蒸馏模型不仅表现更优，且损失曲线更低，展现了更高的数据质量。

AM-Thinking-v1 数据具备多样化的 token 长度分布和更低的困惑度（PPL=2.5），使其更适合训练推理模型。此外，该模型能根据任务难度生成适当的推理长度，展现更强的自适应能力。

a-m-team 开源了 AM-Thinking-v1 和 Qwen3-235B-A22B 的蒸馏数据集，每条数据包括标准化 prompt、推理链、任务分类及评分信息，为社区低成本构建强推理能力提供支持。团队认为，蒸馏数据选择已成为性能上限的关键因素。

这一成果打破了大模型创新停滞的现状，为开源社区提供了新的技术方向。

原文链接

本文链接：https://kx.umi6.com/article/19030.html

转载请注明文章出处

SOTA