IBM于2月11日宣布,其企业级AI开发平台watsonx.ai上线了DeepSeek R1蒸馏模型,包括Llama 3.1 8B和Llama 3.3 70B。该模型利用知识蒸馏技术优化了多个Llama和Qwen变体。用户可在watsonx.ai的“按需部署”目录中部署Llama蒸馏版,或通过“自定义基础模型”功能上传其他变体。DeepSeek R1适用于规划、编程及数学问题求解等多个领域。开发者可利用该模型进行AI解决方案开发,支持直观测试评估、构建RAG管道及主流AI框架。IBM表示,DeepSeek仅用约2000枚英伟达芯片和600万美元成本训练模型,证明小型高效模型同样能带来实际成果。
原文链接
本文链接:https://kx.umi6.com/article/13110.html
转载请注明文章出处
相关推荐
.png)
换一换
人民呼唤DeepSeek!
2025-07-16 12:02:16
DeepSeek降本秘诀曝光
2025-07-05 11:59:25
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版
2025-06-13 16:11:09
DeepSeek们越来越聪明,却也越来越不听话了
2025-05-20 22:46:53
DeepSeek流量下滑,这半年梁文锋都干了啥?
2025-07-14 14:22:04
DeepSeek R1 模型完成小版本试升级
2025-05-28 21:25:08
DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部
2025-07-04 15:46:17
俩人拼出40万的Mac Studio“缝合怪”,双开满血DeepSeek 都不在话下
2025-08-09 11:28:33
国产开源模型强势追击!DeepSeek与OpenAI最新模型实测对决
2025-05-29 16:40:22
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
DeepSeek崩上热搜 内部人员回应:正在处理中,请稍后尝试
2025-05-13 18:58:41
报道称DeepSeek计划年底前发布AI智能体 公司暂无回应
2025-09-04 17:05:24
证监会主席吴清:全球科技创新进入密集活跃期 诸多领域都迎来了Deepseek
2025-06-18 11:39:02
472 文章
160003 浏览
24小时热文
更多

-
2025-09-06 23:39:46
-
2025-09-06 22:39:24
-
2025-09-06 21:38:26