2月21日,AI芯片企业SambaNova宣布推出基于自研SN40L RDU处理器的DeepSeek-R1 671B模型推理云服务,号称“市面最快”。该服务每prompt可达到198个token/s的输出速度。SN40L RDU芯片采用5nm制程,具备独特的三层存储结构,包括520MB SRAM缓存、64GB HBM内存和1.5TB DDR DRAM内存,显著提升了参数容纳量和计算效率。SambaNova称,只需一个包含16个SN40L RDU芯片的机架即可部署DeepSeek-R1 671B。
原文链接
本文链接:https://kx.umi6.com/article/14006.html
转载请注明文章出处
相关推荐
换一换
网易有道全线AI应用接入DeepSeek-R1
2025-02-06 17:34:52
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
2025-02-07 15:00:52
DeepSeek 在网文领域首次应用,阅文“作家助手”升级三大辅助创作功能
2025-02-05 20:13:01
海外用户也有份,传音 Infinix AI 接入 DeepSeek-R1 满血版
2025-02-24 00:07:55
小米澎湃 HyperOS 悄悄下线「超级小爱」“打开深度思考”等 DeepSeek-R1 模型唤醒词
2025-02-15 13:04:37
超越DeepSeek?巨头们不敢说的技术暗战
2025-04-30 19:57:31
易点天下宣布AI技术中台已完成DeepSeek-R1私有化部署
2025-02-05 15:17:50
OPPO ColorOS 正式接入满血 DeepSeek-R1:支持语音唤醒交互,40+机型可体验
2025-02-26 12:31:58
接入DeepSeek-R1联网满血版大模型,联想发布小新Pro系列新品
2025-02-19 10:45:41
全网首测!Qwen3 vs Deepseek-R1数据分析哪家强?
2025-04-30 19:01:00
全国首个,深圳海关智能查验机器人引入“满血版”DeepSeek-R1
2025-04-07 09:46:17
硅基流动助力华为小艺接入 DeepSeek-R1 模型
2025-02-08 00:09:00
成本仅国外三十分之一,中国大模型已经追上美国了?
2025-01-26 08:08:30
639 文章
452373 浏览
24小时热文
更多
-
2026-03-10 13:19:24 -
2026-03-10 13:18:55 -
2026-03-10 12:13:43