近日,记忆张量联合商汤大装置在国产GPGPU上实现业内首个‘记忆—计算—调度’一体化PD分离商用推理集群。相比传统方案,新集群通过MemOS激活记忆体系,使单卡并发效率提升20%,吞吐量提升75%,综合推理性价比达NVIDIA A100的150%。此次合作将PD分离与记忆结构深度耦合,重构业务路径,打破性能上限,并在12台4P8D架构集群上稳定运行。商汤大装置提供系统级基础设施支持,底层算力由算丰信息支撑。这一成果标志着国产算力体系首次具备‘体系级’竞争力,为高性能模型大规模落地降本增效。未来,双方将继续深化合作,探索记忆驱动流水线推理底座及复杂任务编排,推动国产GPU从参数计算向记忆计算转型,定义下一代推理范式。
原文链接
本文链接:https://kx.umi6.com/article/29643.html
转载请注明文章出处
相关推荐
换一换
记忆张量 × 商汤大装置:国产 GPGPU 推理成本反超 A100!
2025-12-04 12:16:28
豆包手机助手:已下线操作银行、互联网支付类APP的能力
2025-12-06 18:44:32
知名数学家辞职投身AI创业:老板是00后华人女生
2025-12-06 11:24:32
2025年的冬天,上海凭什么被称为“世界具身智能第一战场”?
2025-12-05 13:27:12
超捷股份成立机器人科技公司
2025-12-05 10:21:25
英伟达巧用8B模型秒掉GPT-5,开源了
2025-12-06 14:32:11
广西“十五五”规划建议:高标准建设中国—东盟国家人工智能应用合作中心
2025-12-07 10:23:39
截胡 OpenAI:谷歌率先公测“奥数金牌级”推理 AI 模型 Gemini 3 Deep Think
2025-12-05 14:33:37
微软否认下调 AI 销售指标,增长目标≠销售配额
2025-12-05 10:18:06
豆包语音识别模型2.0上线
2025-12-05 16:45:45
黄仁勋很发愁!就算解禁H200 AI GPU 也不知道中国要不要
2025-12-05 12:26:47
谷歌 Gemini 3 反击战:OpenAI GPT-5.2 被曝提前至下周发布,从新功能转向速度与稳定性提升
2025-12-06 09:19:14
山西“十五五”规划建议:加快建成辐射全国的煤炭、焦炭交易中心
2025-12-05 10:20:20
644 文章
355681 浏览
24小时热文
更多
-
2025-12-07 20:45:46 -
2025-12-07 18:40:26 -
2025-12-07 18:39:34