7B小模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM | Transformer作者团队

近日，由Transformer作者之一Llion Jones创立的Sakana AI推出了一种新方法，通过让教师模型模仿人类教师进行‘启发式’教学，显著提升了学生模型的推理能力。该方法中，教师模型不再从头解决问题，而是根据已知答案提供清晰的逐步解释。实验表明，7B规模的教师模型在训练学生模型方面优于671B的DeepSeek-R1，并能有效训练出4倍规模的学生模型。这种方法不仅提高了效率，还降低了成本，使小型模型也能承担教学任务。

原文链接