1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月21日,阿里云在韩国首尔举办的SOSP 2025会议上推出全新AI计算解决方案“Aegaeon”。该方案通过Token级别虚拟化GPU访问,实现多模型共享单个GPU的精细化资源调度,大幅降低硬件浪费。测试显示,在服务数十个720亿参数大模型时,所需NVIDIA H20 GPU数量从1192个降至213个,削减82%。系统通过显存管理、KV缓存优化等技术将模型切换开销降低97%,支持亚秒级响应。目前,该技术已应用于阿里云百炼平台,显著降低大型模型服务商的硬件采购成本。

原文链接
本文链接:https://kx.umi6.com/article/27022.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里云推出全新AI计算解决方案:大模型所需GPU狂降82%!
2025-10-21 11:23:58
西部证券:模型端正在演化为“开源阿里、闭源谷歌”的两极强化
2025-11-24 08:47:19
IDC:中国AI基础设施市场爆发式增长 阿里云市占率第一
2025-10-22 19:50:44
最近上海赚翻了
2026-01-05 18:18:13
英伟达 GPU 用量削减 82%!阿里云打造“AI 性能压榨魔鬼”,213 张卡干 1192 张卡的活
2025-10-18 17:35:54
AI支出低于预期 腾讯回应:我们的GPU充足 足以满足内用
2025-11-14 00:28:01
2026,AI算力新江湖
2026-01-31 12:36:53
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
2025-06-16 17:12:53
科沃斯与阿里云达成全栈 AI 合作,扫地机器人接入通义千问
2025-09-28 15:56:06
阿里云2026年目标:拿下中国AI云市场增量的80%
2026-01-14 13:37:29
服务器严重跟不上订单增速 阿里CEO:3年内不太可能有AI泡沫
2025-11-25 23:12:52
对话季宇:大模型非必须在GPU跑,CPU内存带宽已足够
2025-05-18 15:21:36
阿里云通义千问 Qwen 3 旗舰版模型宣布更新:性能全面提升,超越 Kimi、DeepSeek 等行业顶尖水平
2025-07-22 07:27:05
24小时热文
更多
扫一扫体验小程序