1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
阿里云推出全新AI计算解决方案:大模型所需GPU狂降82%!
10月21日,阿里云在韩国首尔举办的SOSP 2025会议上推出全新AI计算解决方案“Aegaeon”。该方案通过Token级别虚拟化GPU访问,实现多模型共享单个GPU的精细化资源调度,大幅降低硬件浪费。测试显示,在服务数十个720亿参数大模型时,所需NVIDIA H20 GPU数量从1192个降至213个,削减82%。系统通过显存管理、KV缓存优化等技术将模型切换开销降低97%,支持亚秒级响应。目前,该技术已应用于阿里云百炼平台,显著降低大型模型服务商的硬件采购成本。
E-Poet
10-21 11:23:58
Aegaeon
GPU
阿里云
分享至
打开微信扫一扫
内容投诉
生成图片
英特尔打造高效异构 AI 系统:结合自家 Gaudi3 AI 加速器与英伟达 B200 GPU
10月20日,英特尔在2025 OCP全球峰会上展示了一款高效异构AI系统。该系统结合英特尔自家Gaudi3 AI加速器与英伟达B200 GPU,分工明确:B200负责AI模型预填充,Gaudi3负责解码。相比仅使用B200的同构方案,新系统在Llama开源模型上实现了高达70%的同TCO性能提升。此外,这一混合机架系统采用英伟达ConnectX-7 400GbE网卡、BlueField-3 DPU及博通Tomahawk 5交换芯片,扩展能力更强。此创新为AI计算领域带来更高效率和灵活性,值得关注。
跨界思维
10-20 10:04:59
Gaudi3 AI 加速器
英伟达 B200 GPU
英特尔
分享至
打开微信扫一扫
内容投诉
生成图片
破局算力浪费 阿里云AI成果入选顶会 GPU用量削减82%
2025年10月18日,阿里云提出的计算池化解决方案“Aegaeon”成功入选顶级学术会议SOSP 2025。该方案通过GPU资源池化和Token级调度等创新技术,显著提升了AI模型服务中的GPU资源利用率,将英伟达H20 GPU用量削减82%,硬件采购成本大幅降低。在Beta测试中,Aegaeon系统支持单GPU同时运行多达7个模型,有效吞吐量提升1.5-9倍,请求处理能力提高2-2.5倍。这一成果解决了“长尾”模型导致的算力闲置问题,为AI应用提供了更高效的底层系统支撑,标志着系统软件与AI大模型技术融合的新趋势。
星际Code流浪者
10-18 22:39:35
Aegaeon系统
GPU资源
阿里云
分享至
打开微信扫一扫
内容投诉
生成图片
英伟达 GPU 用量削减 82%!阿里云打造“AI 性能压榨魔鬼”,213 张卡干 1192 张卡的活
10月18日,阿里云在韩国首尔举办的第31届操作系统原理研讨会(SOSP)上发布名为“Aegaeon”的计算池化解决方案研究成果。该技术通过创新的GPU资源池化方法,解决了AI模型服务中普遍存在的GPU资源浪费问题。测试显示,在处理数十个720亿参数的大模型时,英伟达H20 GPU用量从1192张减少至213张,削减82%。研究由北京大学与阿里云合作完成,阿里云CTO周靖人也是论文作者之一。SOSP为计算机操作系统领域的顶尖会议,入选论文代表行业最具代表性成果。
代码编织者
10-18 17:35:54
Aegaeon
GPU资源池化
阿里云
分享至
打开微信扫一扫
内容投诉
生成图片
两个月斩获微软四笔订单 “英版甲骨文”或计划明年IPO
英国AI基础设施初创公司Nscale于10月15日宣布与微软扩大合作,计划未来12至18个月内在美国得克萨斯州和葡萄牙部署约11.66万枚英伟达GPU,使欧美地区总部署量达到约20万枚。这是Nscale两个月内与微软达成的第四笔交易,此前双方已在英国和挪威启动多个AI项目。Nscale首席执行官Josh Payne表示,公司计划在明年年底前完成IPO,并提到即将完成新一轮私募融资,估值已达30亿美元。英伟达CEO黄仁勋近期宣布向Nscale投资5亿英镑支持其AI基础设施扩展。Payne强调,市场需求强劲,未来12个月产能几乎售罄,但电力短缺可能成为行业潜在挑战。
Nebula
10-16 00:43:21
GPU
Nscale
微软
分享至
打开微信扫一扫
内容投诉
生成图片
英特尔发布新一代数据中心GPU 代号“Crescent Island”
2025年10月15日,在OCP全球峰会上,英特尔发布代号为“Crescent Island”的新一代数据中心GPU。该产品专为应对快速增长的AI推理工作负载需求设计,提供高内存容量与卓越能效性能,旨在满足现代数据中心的高效运算要求。这一发布凸显英特尔在AI加速领域的持续创新与技术领导力,进一步拓展其在高性能计算市场的产品布局。
AI思维矩阵
10-15 09:34:56
Crescent Island
数据中心GPU
英特尔
分享至
打开微信扫一扫
内容投诉
生成图片
上海:提升智能算力终端规模 牵引自主GPU、互联模块等核心部件规模化应用
上海市经济和信息化委员会日前发布《上海市智能终端产业高质量发展行动方案(2026-2027年)》,提出提升智能算力终端规模,加速边缘智算一体机布局,开发支持大模型轻量化推理的产品。方案旨在打造即插即用的人工智能边端解决方案,推动人工智能赋能千行百业。同时,上海将打造智算服务器终端产业集群,提升万卡集群系统调优能力,集聚优质企业实现百亿级规模,并牵引自主GPU、互联模块等核心部件的规模化应用,助力智能终端产业高质量发展。
梦境编程师
10-14 18:22:31
智能算力终端
自主GPU
边缘智算一体机
分享至
打开微信扫一扫
内容投诉
生成图片
机构:预计今年八大CSP资本支出将逾4200亿美元 同比增长61%
10月13日,TrendForce集邦咨询发布报告显示,受AI服务器需求推动,八大云端服务业者(CSP)包括谷歌、亚马逊、微软、甲骨文、Meta、腾讯、阿里巴巴和百度,预计2025年资本支出将突破4200亿美元,同比增长61%。这一数字接近2023年与2024年总和。报告指出,企业正加速采购英伟达GPU解决方案及扩建数据中心,并加大自研AI芯片投入。此外,2026年这些企业的资本支出有望进一步增长24%,达到5200亿美元以上,重心从短期盈利转向巩固长期竞争力与市场份额。
量子思考者
10-13 19:03:50
AI Server需求
CSP资本支出
GPU整柜式解决方案
分享至
打开微信扫一扫
内容投诉
生成图片
机构:2026年CSP资本支出预计将高达5200亿美元 GPU采购与ASIC研发成创新高核心驱动力
据TrendForce集邦咨询最新调查显示,受AI服务器需求推动,全球八大CSP(包括谷歌、亚马逊云科技、Meta、微软、甲骨文及腾讯、阿里巴巴、百度)正加速采购英伟达GPU整柜解决方案并扩建数据中心,同时加大自研AI ASIC投入。预计2025年其合计资本支出将突破4200亿美元,较2023与2024年总和增长61%。至2026年,随着GB/VR等AI机柜方案持续放量,资本支出将进一步攀升24%,达到5200亿美元以上。支出重点已从短期收益设备转向GPU、服务器等资产,显示企业优先巩固中长期竞争力与市场份额。
Nebula
10-13 12:58:20
AI ASIC研发
CSP资本支出
GPU采购
分享至
打开微信扫一扫
内容投诉
生成图片
机构:2026年CSP资本支出预计将达5200亿美元
据财联社10月13日电,TrendForce集邦咨询预测,2026年八大云服务提供商(CSP)的总资本支出将达5200亿美元以上,同比增长24%。这一增长得益于GB/VR等AI机柜方案的持续放量。同时,资本支出结构发生变化,从直接创收的设备转向服务器、GPU等资产,表明企业更注重中长期竞争力与市场占有率的提升,而非短期获利改善。
数据炼金师
10-13 12:58:10
AI机柜方案
CSP资本支出
Server与GPU
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序