综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月23日,华为数据存储与中科弘云联合发布AI推理加速解决方案。该方案以华为OceanStor A系列存储为数据底座,结合中科弘云HyperCN平台,优化长序列推理体验。方案支持英伟达、昇腾、寒武纪等多元算力,兼容主流框架,并通过Kubernetes实现无缝对接。其核心优势包括异构管理、细粒度算力调度、推理加速及端到端AI工具链。实测显示,在智能问答场景中,首Token时延降低57.5%;在长文档推理中,序列长度为39K时,并发能力提升86%,吞吐提升36%。目前,该方案已在能源电力、智能制造等领域启动试点应用。
原文链接
11月19日,群联电子在美国SC25大会上发布两款PCIe 5.0企业级SSD新品Pascari X201和D201。X201专为数据密集型任务设计,容量达30.72TB,支持U.2/E3.S规格;D201优化云存储性能,容量15.36TB,支持E1.S规格。两款产品均提供14.5GB/s和12GB/s顺序读写速率,随机读写分别达3300K IOPS和1050K IOPS,并有1DWPD/3DWPD耐久配置。同时,群联推出aiDAPTIV+显存扩充方案,可将AI应用性能提升25倍,特定场景响应时间从73秒缩短至4秒,显著加速核显平台AI推理任务。
原文链接
IBM于10月7日宣布,其AI推理加速器Spyre将在本季度正式投入商业使用。z17和LinuxONE 5将于10月28日支持Spyre,而Power11则预计在12月初支持该组件。Spyre采用PCIe AIC卡设计,功耗75W,每卡含32个加速器核心,基于5nm工艺制程,晶体管数量达256亿。z17和LinuxONE 5单机最多可部署48张Spyre卡,Power11支持16张。IBM表示,Spyre允许企业客户在本地运行多模态AI推理任务,在提升业务效率的同时确保数据与应用的安全性。
原文链接
加载更多
暂无内容