2025年10月18日,阿里云提出的计算池化解决方案“Aegaeon”成功入选顶级学术会议SOSP 2025。该方案通过GPU资源池化和Token级调度等创新技术,显著提升了AI模型服务中的GPU资源利用率,将英伟达H20 GPU用量削减82%,硬件采购成本大幅降低。在Beta测试中,Aegaeon系统支持单GPU同时运行多达7个模型,有效吞吐量提升1.5-9倍,请求处理能力提高2-2.5倍。这一成果解决了“长尾”模型导致的算力闲置问题,为AI应用提供了更高效的底层系统支撑,标志着系统软件与AI大模型技术融合的新趋势。
原文链接
本文链接:https://kx.umi6.com/article/26909.html
转载请注明文章出处
相关推荐
.png)
换一换
传音控股与阿里云达成合作,旗下 AI 手机已搭载通义千问大模型
2025-01-07 16:06:09
阿里云与零一万物达成战略合作,成立“产业大模型联合实验室”
2025-01-02 17:20:19
股价暴涨背后,阿里和百度的野心都藏不住了!
2025-09-28 08:50:42
全球第一:阿里云宣布通义千问 Qwen2.5-Max 数学及编程能力登顶最新 AI 大模型榜单
2025-02-05 19:13:15
消息称阿里洽谈收购零一万物的预训练团队,人员约为 60 人
2025-01-06 22:39:38
从 DeepSeek 火热,到李飞飞团队新成果,“幕后高手”竟是它
2025-02-07 14:57:31
阿里云推出自动驾驶模型训练推理加速框架,训练时间可缩短50%
2025-06-23 21:29:50
科沃斯与阿里云达成全栈 AI 合作,扫地机器人接入通义千问
2025-09-28 15:56:06
国产 AI 初创企业硅基流动完成新一轮数亿元融资,阿里云领投
2025-06-09 18:34:09
AI应用突围,中小企业的新周期已至
2025-04-11 19:00:29
阿里吴泳铭:2032年阿里云全球数据中心能耗规模将比2022年提升10倍 意味着阿里云算力投入将指数级提升
2025-09-24 11:38:31
马云不必回归阿里
2025-05-12 16:36:43
独家|阿里云启动“T项目” 加速AI研发
2025-03-17 14:46:39
545 文章
243613 浏览
24小时热文
更多

-
2025-10-19 17:51:16
-
2025-10-19 15:55:57
-
2025-10-19 15:54:59