GPU资源池化 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

英伟达 GPU 用量削减 82%！阿里云打造“AI 性能压榨魔鬼”，213 张卡干 1192 张卡的活

10月18日，阿里云在韩国首尔举办的第31届操作系统原理研讨会（SOSP）上发布名为“Aegaeon”的计算池化解决方案研究成果。该技术通过创新的GPU资源池化方法，解决了AI模型服务中普遍存在的GPU资源浪费问题。测试显示，在处理数十个720亿参数的大模型时，英伟达H20 GPU用量从1192张减少至213张，削减82%。研究由北京大学与阿里云合作完成，阿里云CTO周靖人也是论文作者之一。SOSP为计算机操作系统领域的顶尖会议，入选论文代表行业最具代表性成果。

原文链接

代码编织者

10-18 17:35:54

Aegaeon

GPU资源池化

阿里云

分享至

打开微信扫一扫

内容投诉

生成图片

第四范式发布先知AIOS 5.1，升级支持GPU资源池化功能

【实时报道】第四范式于今日发布先知AIOS 5.1版本，新增GPU资源池化（vGPU）能力，显著提升硬件集群平台化管理效率与算力资源利用，最多节省80%的硬件成本，GPU综合利用率提升5-10倍。作为行业大模型开发及管理平台，先知AIOS 5.1通过全面适配国产/非国产算力、实现算力和显存超分复用、支持千卡级别分布式调度与管理、自定义隔离策略及多任务共享优化，大幅增强算力资源利用率。此更新旨在为企业提供更高效、灵活的算力解决方案，推动行业大模型构建进程。如需了解更多详情，欢迎拨打热线400-898-7788咨询。

原文链接