1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2026年4月,月之暗面与清华大学联合发布新论文,提出Prefill-as-a-Service(PrFaaS)架构,解决大模型推理中的跨机房调度难题。核心突破在于实现KV Cache跨数据中心传输,将Prefill和Decode解耦至异构集群,显著优化长上下文场景性能。实验显示,相比传统同构部署,吞吐量提升54%,P90延迟降低64%,且仅占用13Gbps带宽,普通商用以太网即可承载。研究团队由清华大学郑纬民院士、武永卫教授及月之暗面工程团队组成,一作为清华博士生秦若愚。该成果基于混合注意力模型架构,为分布式推理提供高效可行的工程方案。

原文链接
本文链接:https://kx.umi6.com/article/34943.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
具身智能为什么还没真正落地?问题卡在这|沙龙报名
2026-04-16 10:52:19
第一批学AI的大学生 已经笑不出来了
2026-04-19 15:07:03
为AI时代“瘦身”!Snap宣布裁员1000人并冻结300余空缺
2026-04-16 17:12:27
国家发改委:今年将重点在“人工智能+”基础设施、城市更新、国家水网、新型能源体系等领域 开展一系列扩大有效投资行动
2026-04-17 12:01:31
美银:2030年全球服务器市场将达1.5万亿美元 AI贡献超八成份额
2026-04-17 20:21:20
Anthropic计划下周向英国银行业发布其Mythos模型
2026-04-16 20:22:25
教育部发布《中国青少年阅读素养框架》教育行业标准
2026-04-17 20:23:35
刚刚,机器人练成了宁次的「白眼」:∞帧画面边看边3D重建我们的世界!
2026-04-16 22:21:46
开云集团联手谷歌计划2027年推出Gucci高端智能眼镜
2026-04-17 18:17:53
11.58万,全系Lidar+L4同源算法,广汽文远把城区NOA打成白菜价
2026-04-17 17:11:26
Anthropic升级主力模型新版本 但“削弱”网络攻防能力
2026-04-17 16:10:59
全球算力告急!OpenAI豪掷1450亿疯狂囤算力
2026-04-17 18:16:48
哈工大赵杰:重视人形机器人作为技术母体的溢出效应
2026-04-17 13:03:01
24小时热文
更多
扫一扫体验小程序