综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
10月18日,阿里云在韩国首尔举办的第31届操作系统原理研讨会(SOSP)上发布名为“Aegaeon”的计算池化解决方案研究成果。该技术通过创新的GPU资源池化方法,解决了AI模型服务中普遍存在的GPU资源浪费问题。测试显示,在处理数十个720亿参数的大模型时,英伟达H20 GPU用量从1192张减少至213张,削减82%。研究由北京大学与阿里云合作完成,阿里云CTO周靖人也是论文作者之一。SOSP为计算机操作系统领域的顶尖会议,入选论文代表行业最具代表性成果。
原文链接
【实时报道】第四范式于今日发布先知AIOS 5.1版本,新增GPU资源池化(vGPU)能力,显著提升硬件集群平台化管理效率与算力资源利用,最多节省80%的硬件成本,GPU综合利用率提升5-10倍。作为行业大模型开发及管理平台,先知AIOS 5.1通过全面适配国产/非国产算力、实现算力和显存超分复用、支持千卡级别分布式调度与管理、自定义隔离策略及多任务共享优化,大幅增强算力资源利用率。此更新旨在为企业提供更高效、灵活的算力解决方案,推动行业大模型构建进程。如需了解更多详情,欢迎拨打热线400-898-7788咨询。
原文链接
加载更多
暂无内容