
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年10月18日,阿里云提出的计算池化解决方案“Aegaeon”成功入选顶级学术会议SOSP 2025。该方案通过GPU资源池化和Token级调度等创新技术,显著提升了AI模型服务中的GPU资源利用率,将英伟达H20 GPU用量削减82%,硬件采购成本大幅降低。在Beta测试中,Aegaeon系统支持单GPU同时运行多达7个模型,有效吞吐量提升1.5-9倍,请求处理能力提高2-2.5倍。这一成果解决了“长尾”模型导致的算力闲置问题,为AI应用提供了更高效的底层系统支撑,标志着系统软件与AI大模型技术融合的新趋势。
原文链接
10月18日,阿里云在韩国首尔举办的第31届操作系统原理研讨会(SOSP)上发布名为“Aegaeon”的计算池化解决方案研究成果。该技术通过创新的GPU资源池化方法,解决了AI模型服务中普遍存在的GPU资源浪费问题。测试显示,在处理数十个720亿参数的大模型时,英伟达H20 GPU用量从1192张减少至213张,削减82%。研究由北京大学与阿里云合作完成,阿里云CTO周靖人也是论文作者之一。SOSP为计算机操作系统领域的顶尖会议,入选论文代表行业最具代表性成果。
原文链接
加载更多

暂无内容