
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
IBM于2月11日宣布,其企业级AI开发平台watsonx.ai上线了DeepSeek R1蒸馏模型,包括Llama 3.1 8B和Llama 3.3 70B。该模型利用知识蒸馏技术优化了多个Llama和Qwen变体。用户可在watsonx.ai的“按需部署”目录中部署Llama蒸馏版,或通过“自定义基础模型”功能上传其他变体。DeepSeek R1适用于规划、编程及数学问题求解等多个领域。开发者可利用该模型进行AI解决方案开发,支持直观测试评估、构建RAG管道及主流AI框架。IBM表示,DeepSeek仅用约2000枚英伟达芯片和600万美元成本训练模型,证明小型高效模型同样能带来实际成果。
原文链接
加载更多

暂无内容