5月21日,智谱发布新型推理集群组网架构ZCube,已在生产环境完成验证。该架构在不新增GPU、不更换服务器、不修改代码的情况下,实现集群推理吞吐量提升15%,首Token响应尾延迟(TTFT P99)下降40.6%。同时,交换机与光模块硬件成本减少三分之一。这一成果或将推动大规模AI集群组网采购向“更少层级、更大端口密度”演进,并促使光模块需求向更高速率集中,为AI基础设施优化提供新方向。(记者 李明明)
原文链接
本文链接:https://kx.umi6.com/article/36061.html
转载请注明文章出处
相关推荐
换一换
智谱先冲向了IPO
2025-04-15 20:40:54
MiniMax 港股 IPO 获中国证监会备案,与智谱角逐“AI 大模型第一股”
2025-12-22 23:06:29
智谱创始人唐杰谈 DeepSeek:很震撼,开启了“AI 做事”新范式
2026-01-12 09:23:20
老外担心中国大模型也学OpenAI闭源 智谱回应:别慌 会继续开源
2026-03-21 12:05:31
知情人士:智谱同时准备香港、A 股 IPO 工作,A 股上市概率较高
2025-07-11 16:41:33
智谱将开源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414
2025-03-31 10:26:26
智谱 GLM Coding Plan 官宣暂时限售:1 月 23 日开启,每日 10:00 刷新额度
2026-01-21 15:16:40
智谱联合华为开源首个国产芯片训练的多模态SOTA模型
2026-01-14 09:24:34
智谱 GLM-4.7-Flash 模型发布并开源,可免费调用
2026-01-20 09:47:20
美国禁掉Fable5后 智谱暴涨47%
2026-06-18 00:02:46
上海国资10亿元投向智谱 加码打造人工智能产业生态
2025-07-03 14:23:01
智谱:香港IPO拟发行逾3700万股 定价116.2港元
2025-12-30 07:05:53
智谱打响中场战事
2025-09-06 06:30:37
757 文章
769964 浏览
24小时热文
更多
-
2026-07-05 14:40:04 -
2026-07-04 23:08:47 -
2026-07-04 22:07:26