1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2月11日,华为技术有限公司宣布MindSpeed支持DeepSeek V3模型的预训练和微调,并且昇腾适配支持DeepSeek-R1复现项目Open R1。DeepSeek团队通过知识蒸馏使小模型具备强推理能力,华为已完成自定义蒸馏模型训练。此外,华为昇腾还完成了Open R1项目的GRPO流程打通,支持通过vLLM等生态库实现训练中的数据生成。Open R1项目由Hugging Face官方开源,旨在完全开放式复现DeepSeek-R1模型流程,目前已有18K+星数。

原文链接
本文链接:https://kx.umi6.com/article/13138.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
2025-02-12 13:26:11
小米澎湃 HyperOS 悄悄下线「超级小爱」“打开深度思考”等 DeepSeek-R1 模型唤醒词
2025-02-15 13:04:37
接入 DeepSeek-R1,星纪魅族 21、20 系列等机型 Aicy 语音助手获 11.3.19 版本升级
2025-02-11 02:29:56
24小时热文
更多
扫一扫体验小程序