1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月21日,阿里云在韩国首尔举办的SOSP 2025会议上推出全新AI计算解决方案“Aegaeon”。该方案通过Token级别虚拟化GPU访问,实现多模型共享单个GPU的精细化资源调度,大幅降低硬件浪费。测试显示,在服务数十个720亿参数大模型时,所需NVIDIA H20 GPU数量从1192个降至213个,削减82%。系统通过显存管理、KV缓存优化等技术将模型切换开销降低97%,支持亚秒级响应。目前,该技术已应用于阿里云百炼平台,显著降低大型模型服务商的硬件采购成本。

原文链接
本文链接:https://kx.umi6.com/article/27022.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
马斯克 Colossus 超算首阶段全面投用:20 万个 GPU、150MW 备用电池加持
2025-05-08 20:38:19
权威报告:中国AI云市场阿里云占比35.8%位列第一 高于2到4名的总和
2025-09-09 11:13:28
参数超万亿:阿里发布通义千问最强 AI 大模型 Qwen3-Max 正式版,性能全面领先
2025-09-24 11:36:59
AI与汽车加速融合 阿里云全栈AI已支撑全部中国车企!
2025-09-25 17:07:45
阿里CEO吴泳铭:加速打造全球云计算一张网 支持中企出海
2025-05-22 10:25:59
阿里2025财年Q4财报:营收2364.5亿元 AI收入连续七季度三位数增长
2025-05-16 14:49:21
国家天文台联合阿里云发布国际首个太阳大模型
2025-04-01 18:46:22
阿里财报电话会:与SAP达成云和AI领域合作
2025-08-29 20:45:42
马云再度现身 参与阿里云新财年启动会 高度重视AI和云
2025-04-10 18:04:55
服务器严重跟不上订单增速 阿里CEO:3年内不太可能有AI泡沫
2025-11-25 23:12:52
阿里云将投超4亿元支持国际生态建设
2025-07-03 13:23:44
阿里云将在韩国启用第二座数据中心 满足生成式AI需求
2025-06-19 10:50:10
AI性能提升400%,Imagination全新端侧GPU芯片IP用于工业视觉等场景
2025-05-08 12:31:00
24小时热文
更多
扫一扫体验小程序