1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月21日,阿里云在韩国首尔举办的SOSP 2025会议上推出全新AI计算解决方案“Aegaeon”。该方案通过Token级别虚拟化GPU访问,实现多模型共享单个GPU的精细化资源调度,大幅降低硬件浪费。测试显示,在服务数十个720亿参数大模型时,所需NVIDIA H20 GPU数量从1192个降至213个,削减82%。系统通过显存管理、KV缓存优化等技术将模型切换开销降低97%,支持亚秒级响应。目前,该技术已应用于阿里云百炼平台,显著降低大型模型服务商的硬件采购成本。

原文链接
本文链接:https://kx.umi6.com/article/27022.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里云百炼官宣通义千问3-Max模型降价
2025-11-13 23:26:41
阿里启动超百亿元融资
2025-07-09 17:06:45
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
2025-06-16 17:12:53
阿里CEO吴泳铭:阿里云AI服务器上架节奏“严重跟不上订单增速”
2025-11-25 22:10:41
亚太唯一!Gartner最新报告:阿里云在生成式AI四大维度均领先
2025-11-24 19:12:05
易点天下与阿里云达成全面深化合作,加速助力中国企业出海服务与智能营销发展
2025-08-11 12:01:15
国产GPU领军企业壁仞科技成功登陆香港交易所
2026-01-03 19:24:24
DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配
2025-09-30 10:23:35
消息称阿里云首次出手具身智能,自变量机器人完成近 10 亿元新融资
2025-09-08 08:56:27
计算所严明玉团队新作: Attention 并非永远是瓶颈,多 GPU 并不一定更快
2025-12-22 11:41:00
阿里云连续三年稳居“中企出海AI云服务”领导者!
2026-02-03 14:41:45
阿里云与英伟达联合推动具身智能应用落地
2025-09-24 15:43:00
性能赶超NVIDIA!阿里云AI算力服务大涨价 最高达34%
2026-03-19 15:05:35
24小时热文
更多
扫一扫体验小程序