2025年10月18日,阿里云提出的计算池化解决方案“Aegaeon”成功入选顶级学术会议SOSP 2025。该方案通过GPU资源池化和Token级调度等创新技术,显著提升了AI模型服务中的GPU资源利用率,将英伟达H20 GPU用量削减82%,硬件采购成本大幅降低。在Beta测试中,Aegaeon系统支持单GPU同时运行多达7个模型,有效吞吐量提升1.5-9倍,请求处理能力提高2-2.5倍。这一成果解决了“长尾”模型导致的算力闲置问题,为AI应用提供了更高效的底层系统支撑,标志着系统软件与AI大模型技术融合的新趋势。
原文链接
本文链接:https://kx.umi6.com/article/26909.html
转载请注明文章出处
相关推荐
换一换
消息称阿里云启动“T 项目”,加速下一代 AI 技术研发
2025-03-17 15:45:01
马年4大顶流模型会师阿里云Coding Plan开工!Token量大管饱,自由切换真香
2026-02-26 00:01:12
阿里最新AI编程大模型上线 百万Tokens价格为Claude 4的1/3
2025-07-23 21:59:15
阿里“通云哥”浮出水面 自研AI芯片“真武”性能比肩英伟达H20
2026-01-29 11:12:19
阿里云造“Agent工厂”,百炼MCP服务上线,无需代码5分钟建Agent
2025-04-09 17:58:11
DeepSeek全尺寸模型上线阿里云百炼
2025-02-09 14:48:13
服务器严重跟不上订单增速 阿里CEO:3年内不太可能有AI泡沫
2025-11-25 23:12:52
独家|阿里云启动“T项目” 加速AI研发
2025-03-17 14:46:39
阿里云宣布支持云上一键部署DeepSeek-V3、DeepSeek-R1
2025-02-03 23:21:42
阿里云推出AI加速框架 模型训练时间缩短50%
2025-06-23 16:27:28
阿里云荣获亚太Agentic AI开发平台市场领导者 核心能力比肩AWS、谷歌、微软
2026-02-12 12:21:43
易点天下与阿里云达成全面深化合作,加速助力中国企业出海服务与智能营销发展
2025-08-11 12:01:15
阿里云:采购寒武纪15万片GPU的消息不实,寒武纪股价跳水
2025-09-01 11:16:19
688 文章
486251 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18