华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

2025-02-11 18:59:29

Oasis

发布在

快讯

阅读：78

2月11日，华为技术有限公司宣布MindSpeed支持DeepSeek V3模型的预训练和微调，并且昇腾适配支持DeepSeek-R1复现项目Open R1。DeepSeek团队通过知识蒸馏使小模型具备强推理能力，华为已完成自定义蒸馏模型训练。此外，华为昇腾还完成了Open R1项目的GRPO流程打通，支持通过vLLM等生态库实现训练中的数据生成。Open R1项目由Hugging Face官方开源，旨在完全开放式复现DeepSeek-R1模型流程，目前已有18K+星数。

原文链接

本文链接：https://kx.umi6.com/article/13138.html

转载请注明文章出处

DeepSeek-R1