10月21日,阿里云在韩国首尔举办的SOSP 2025会议上推出全新AI计算解决方案“Aegaeon”。该方案通过Token级别虚拟化GPU访问,实现多模型共享单个GPU的精细化资源调度,大幅降低硬件浪费。测试显示,在服务数十个720亿参数大模型时,所需NVIDIA H20 GPU数量从1192个降至213个,削减82%。系统通过显存管理、KV缓存优化等技术将模型切换开销降低97%,支持亚秒级响应。目前,该技术已应用于阿里云百炼平台,显著降低大型模型服务商的硬件采购成本。
原文链接
本文链接:https://kx.umi6.com/article/27022.html
转载请注明文章出处
相关推荐
换一换
美国封锁吧!BAT三巨头纷纷抛弃NVIDIA 支持国产AI GPU
2025-05-31 15:07:08
西部证券:模型端正在演化为“开源阿里、闭源谷歌”的两极强化
2025-11-24 08:47:19
最近上海赚翻了
2026-01-05 18:18:13
阿里云通义千问 Qwen 3 旗舰版模型宣布更新:性能全面提升,超越 Kimi、DeepSeek 等行业顶尖水平
2025-07-22 07:27:05
阿里最新AI编程大模型上线 百万Tokens价格为Claude 4的1/3
2025-07-23 21:59:15
把 AI 大模型嵌入数据库,阿里云 PolarDB 发布 AI 数据湖库等能力
2026-01-20 14:09:31
阿里云:采购寒武纪15万片GPU的消息不实,寒武纪股价跳水
2025-09-01 11:16:19
摩尔线程率先支持腾讯混元-A13B 模型,完成全功能 GPU 深度适配
2025-06-29 18:32:47
消息称阿里云首次出手具身智能,自变量机器人完成近 10 亿元新融资
2025-09-08 08:56:27
阿里CEO吴泳铭:阿里云AI服务器上架节奏“严重跟不上订单增速”
2025-11-25 22:10:41
阿里云2026财年Q2营收激增34%:AI收入连续9个季度三位数增长
2025-11-25 20:05:22
韩国内阁通过 1.8 万亿韩元 AI 投资补充预算:一年内要买 10000 块 GPU
2025-04-22 12:17:17
阿里CEO吴泳铭:加速打造全球云计算一张网 支持中企出海
2025-05-22 10:25:59
683 文章
452965 浏览
24小时热文
更多
-
2026-01-23 21:15:09 -
2026-01-23 21:14:01 -
2026-01-23 20:15:45