5月21日,智谱发布新型推理集群组网架构ZCube,已在生产环境完成验证。该架构在不新增GPU、不更换服务器、不修改代码的情况下,实现集群推理吞吐量提升15%,首Token响应尾延迟(TTFT P99)下降40.6%。同时,交换机与光模块硬件成本减少三分之一。这一成果或将推动大规模AI集群组网采购向“更少层级、更大端口密度”演进,并促使光模块需求向更高速率集中,为AI基础设施优化提供新方向。(记者 李明明)
原文链接
本文链接:https://kx.umi6.com/article/36061.html
转载请注明文章出处
相关推荐
换一换
智谱携“沉思”加入Agent“混战” 记者实测结果来了!
2025-04-03 08:08:40
智谱:香港IPO拟发行逾3700万股 定价116.2港元
2025-12-30 07:05:53
智谱发布首款SOTA级原生智能体大模型
2025-07-28 21:20:48
智谱与生数科技达成战略合作
2025-04-27 15:29:57
投资界24h | MiniMax、智谱通过港交所聆讯;红杉中国买下「小脏鞋」;江苏社保科创基金完成备案
2025-12-22 10:41:44
智谱公布“降智”的秘密:Scaling不可避免的痛
2026-05-01 19:43:14
全球大模型第一股要来了 智谱发布IPO招股书:代码能力并列全球第一
2025-12-19 23:17:39
智谱开源GLM-4.7-Flash模型
2026-01-20 16:17:32
优刻得与智谱签署合作协议 接入智谱GLM-4.5V
2025-08-13 11:36:27
港股AI应用股走强 智谱尾盘涨幅一度扩大至37%
2026-02-20 16:34:30
智谱联合华为开源首个国产芯片训练的多模态SOTA模型
2026-01-14 09:24:34
北京市人工智能产业投资基金追加投资智谱2亿元
2025-04-17 19:51:35
智谱中标679.8万元水电大模型项目
2025-11-05 20:23:03
738 文章
620552 浏览
24小时热文
更多
-
2026-05-21 12:41:05 -
2026-05-21 12:40:00 -
2026-05-21 11:41:43