2月3日,Gitee AI联合沐曦首发了DeepSeek R1千问蒸馏模型系列,包括DeepSeek-R1-Distill-Qwen-1.5B、7B、14B和32B四个版本,全部部署于国产沐曦曦云GPU上。这些较小尺寸的模型适合企业内部部署,能有效降低成本。DeepSeek R1是一款拥有6710亿参数的大型混合专家模型,新发布的蒸馏模型虽参数较少,但性能接近大参数模型。此次合作实现了从芯片到平台的全国产研发,且Gitee AI平台现提供免费体验。
原文链接
本文链接:https://kx.umi6.com/article/12513.html
转载请注明文章出处
相关推荐
换一换
昆仑万维天工 AI 上线 DeepSeek R1 + 联网搜索,可优化 R1 偶尔崩溃问题
2025-02-08 17:28:13
效率革命还是资源黑洞?DeepSeek R1背后的杰文斯悖论探讨
2025-02-15 22:11:06
“李飞飞团队50美元炼出DeepSeek R1”,如何被曲解了?
2025-02-07 16:04:56
秘塔 AI 接入满血版 DeepSeek R1 推理模型
2025-02-03 11:04:51
DeepSeek使用技巧,你收藏这一篇就够了
2025-02-07 21:09:11
昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索
2025-02-10 18:14:14
图文并茂:DeepSeek R1 是怎么练成的
2025-02-18 11:11:33
七彩虹“虹光 AI”智能模型助手官宣接入满血 DeepSeek R1
2025-02-08 18:30:44
美团开源首发 INT8 无损满血版 DeepSeek R1,部署 A100 实现 50% 吞吐提升
2025-03-07 19:05:33
高通 CEO 安蒙称 DeepSeek R1 模型对高通有利,能直接在本地设备上运行
2025-02-06 17:39:06
DeepSeek R1遇难题142次”I give up”,研究还称需增加推理时机控制机制
2025-02-14 13:35:29
硅基流动上线 DeepSeek R1 & V3 企业级服务
2025-02-10 21:21:28
科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1
2025-03-03 10:16:41
742 文章
595331 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17