1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月21日,阿里云在韩国首尔举办的SOSP 2025会议上推出全新AI计算解决方案“Aegaeon”。该方案通过Token级别虚拟化GPU访问,实现多模型共享单个GPU的精细化资源调度,大幅降低硬件浪费。测试显示,在服务数十个720亿参数大模型时,所需NVIDIA H20 GPU数量从1192个降至213个,削减82%。系统通过显存管理、KV缓存优化等技术将模型切换开销降低97%,支持亚秒级响应。目前,该技术已应用于阿里云百炼平台,显著降低大型模型服务商的硬件采购成本。

原文链接
本文链接:https://kx.umi6.com/article/27022.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI与汽车加速融合 阿里云全栈AI已支撑全部中国车企!
2025-09-25 17:07:45
权威报告:中国AI云市场阿里云占比35.8%位列第一 高于2到4名的总和
2025-09-09 11:13:28
海外市场增长20倍!阿里云加码全球化:将于马来西亚和菲律宾新增数据中心
2025-07-02 10:35:07
阿里云:今年将在全球节点部署全栈AI能力
2025-06-24 13:17:17
xAI Grok 3 仅用 8 分钟破解美国本科生最难数赛题,马斯克要用 100 万 GPU 反超“星际之门”
2025-02-24 13:25:45
消息称阿里云启动“T 项目”,加速下一代 AI 技术研发
2025-03-17 15:45:01
马云再度现身 参与阿里云新财年启动会 高度重视AI和云
2025-04-10 18:04:55
阿里云为什么要押注 Coding AI
2025-07-25 17:31:51
计算的未来:英伟达王冠正摇摇欲坠
2025-04-30 20:28:07
AI火花集|10位AI火花先锋揭晓,看AI应用如何“改写”商业世界?
2025-04-17 17:42:55
韩国希望跻身“AI三大强国” 1.8万块GPU采购计划已提上日程
2025-02-20 17:22:08
马斯克 Colossus 超算首阶段全面投用:20 万个 GPU、150MW 备用电池加持
2025-05-08 20:38:19
阿里云发布全新一代磐久128超节点AI服务器
2025-09-24 19:50:40
24小时热文
更多
扫一扫体验小程序