1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月21日,阿里云在韩国首尔举办的SOSP 2025会议上推出全新AI计算解决方案“Aegaeon”。该方案通过Token级别虚拟化GPU访问,实现多模型共享单个GPU的精细化资源调度,大幅降低硬件浪费。测试显示,在服务数十个720亿参数大模型时,所需NVIDIA H20 GPU数量从1192个降至213个,削减82%。系统通过显存管理、KV缓存优化等技术将模型切换开销降低97%,支持亚秒级响应。目前,该技术已应用于阿里云百炼平台,显著降低大型模型服务商的硬件采购成本。

原文链接
本文链接:https://kx.umi6.com/article/27022.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里云AI算力和存储产品最高涨价34%
2026-03-18 13:17:53
阿里云申请注册HiClaw商标
2026-03-18 15:36:17
阿里云发布函数计算AgentRun
2025-12-10 18:06:19
阿里云百炼官宣通义千问3-Max模型降价
2025-11-13 23:26:41
阿里云为什么要押注 Coding AI
2025-07-25 17:31:51
阿里宣布Qwen3.5开源家族扩容
2026-02-25 12:17:28
阿里云2026财年Q2营收激增34%:AI收入连续9个季度三位数增长
2025-11-25 20:05:22
阿里云宣布通义完成安全升级
2025-09-25 18:09:38
消息称阿里云首次出手具身智能,自变量机器人完成近 10 亿元新融资
2025-09-08 08:56:27
阿里发布电影级视频模型万相2.6
2025-12-16 13:40:51
阿里云“联姻”英伟达:Physical AI生态一触即发
2025-09-24 15:46:54
阿里云与英伟达联合推动具身智能应用落地
2025-09-24 15:43:00
汽车行业已在阿里云上使用超10万卡“真武”PPU研发智驾
2026-04-11 10:57:51
24小时热文
更多
扫一扫体验小程序