2025年10月18日,阿里云提出的计算池化解决方案“Aegaeon”成功入选顶级学术会议SOSP 2025。该方案通过GPU资源池化和Token级调度等创新技术,显著提升了AI模型服务中的GPU资源利用率,将英伟达H20 GPU用量削减82%,硬件采购成本大幅降低。在Beta测试中,Aegaeon系统支持单GPU同时运行多达7个模型,有效吞吐量提升1.5-9倍,请求处理能力提高2-2.5倍。这一成果解决了“长尾”模型导致的算力闲置问题,为AI应用提供了更高效的底层系统支撑,标志着系统软件与AI大模型技术融合的新趋势。
原文链接
本文链接:https://kx.umi6.com/article/26909.html
转载请注明文章出处
相关推荐
换一换
阿里云将投超4亿元支持国际生态建设
2025-07-03 13:23:44
乐聚机器人与阿里云达成全栈AI合作
2026-01-08 18:25:41
阿里收购零一万物?李开复连夜辟谣
2025-01-07 15:05:52
阿里云发布多模态交互开发套件 可应用于AI眼镜、机器人等
2026-01-08 12:17:50
近年规模最大!阿里云开启AI人才校园招聘:面向清华、北大、斯坦福等高校
2025-03-25 16:05:36
阿里最新AI编程大模型上线 百万Tokens价格为Claude 4的1/3
2025-07-23 21:59:15
GPU 资源告急,OpenAI 计划减少 Sora 免费生成视频次数
2025-10-31 07:20:30
阿里云百炼官宣通义千问3-Max模型降价
2025-11-13 23:26:41
硅基流动新获阿里领投数亿元融资
2025-06-09 19:35:13
阿里财报电话会:与SAP达成云和AI领域合作
2025-08-29 20:45:42
科沃斯与阿里云达成全栈 AI 合作,扫地机器人接入通义千问
2025-09-28 15:56:06
阿里云将在韩国启用第二座数据中心 满足生成式AI需求
2025-06-19 10:50:10
消息称阿里云启动“T 项目”,加速下一代 AI 技术研发
2025-03-17 15:45:01
653 文章
425028 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55