
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2月11日,华为技术有限公司宣布MindSpeed支持DeepSeek V3模型的预训练和微调,并且昇腾适配支持DeepSeek-R1复现项目Open R1。DeepSeek团队通过知识蒸馏使小模型具备强推理能力,华为已完成自定义蒸馏模型训练。此外,华为昇腾还完成了Open R1项目的GRPO流程打通,支持通过vLLM等生态库实现训练中的数据生成。Open R1项目由Hugging Face官方开源,旨在完全开放式复现DeepSeek-R1模型流程,目前已有18K+星数。
原文链接
加载更多

暂无内容