1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

IBM于2月11日宣布,其企业级AI开发平台watsonx.ai上线了DeepSeek R1蒸馏模型,包括Llama 3.1 8B和Llama 3.3 70B。该模型利用知识蒸馏技术优化了多个Llama和Qwen变体。用户可在watsonx.ai的“按需部署”目录中部署Llama蒸馏版,或通过“自定义基础模型”功能上传其他变体。DeepSeek R1适用于规划、编程及数学问题求解等多个领域。开发者可利用该模型进行AI解决方案开发,支持直观测试评估、构建RAG管道及主流AI框架。IBM表示,DeepSeek仅用约2000枚英伟达芯片和600万美元成本训练模型,证明小型高效模型同样能带来实际成果。

原文链接
本文链接:https://kx.umi6.com/article/13110.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek独占鳌头!中国AI原生App月活突破2.4亿:豆包、元宝紧随
2025-04-16 15:08:29
西门子 CTO 大夸 DeepSeek:预计三五年后西门子的所有产品都将融入 AI 元素
2025-06-25 15:32:02
DeepSeek核心高管离职创业,瞄准Agent赛道|独家
2025-06-09 16:30:51
24小时热文
更多
扫一扫体验小程序