2月21日,AI芯片企业SambaNova宣布推出基于自研SN40L RDU处理器的DeepSeek-R1 671B模型推理云服务,号称“市面最快”。该服务每prompt可达到198个token/s的输出速度。SN40L RDU芯片采用5nm制程,具备独特的三层存储结构,包括520MB SRAM缓存、64GB HBM内存和1.5TB DDR DRAM内存,显著提升了参数容纳量和计算效率。SambaNova称,只需一个包含16个SN40L RDU芯片的机架即可部署DeepSeek-R1 671B。
原文链接
本文链接:https://kx.umi6.com/article/14006.html
转载请注明文章出处
相关推荐
换一换
网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一
2025-06-17 16:24:38
黄仁勋:DeepSeek R1点燃了全球热情
2025-02-27 21:42:17
DeepSeek-R1开创历史 梁文锋论文登上《自然》封面
2025-09-18 07:46:43
支持 API 调用,国家超算互联网平台上线 DeepSeek-R1 满血版
2025-02-09 22:53:25
国行三星 Galaxy S25 系列手机官宣支持 DeepSeek-R1 大模型,进入 AI“智能体中心”即可体验
2025-03-03 22:41:56
比偶然更好的事情是必然
2025-02-01 14:27:09
网易云音乐接入 DeepSeek-R1 大模型,用于歌曲智能推荐等领域
2025-02-19 08:39:53
三星生活助手 App 智能体中心接入 DeepSeek-R1
2025-02-28 20:25:28
DeepSeek-R1持续震撼硅谷
2025-01-26 06:07:15
腾讯元宝接入Deepseek-R1满血版 支持联网搜索并整合公众号信息源
2025-02-13 17:23:01
DeepSeek-R1超级外挂!“人类最后的考试”首次突破30分,上海交大等开源方案碾压OpenAI、谷歌
2025-07-09 14:04:55
腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态
2025-02-13 16:04:01
DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看
2025-01-25 14:58:49
675 文章
532423 浏览
24小时热文
更多
-
2026-04-24 23:43:31 -
2026-04-24 23:42:26 -
2026-04-24 23:41:21