综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
1月27日,国产GPU厂商曦望在杭州发布新一代推理GPU芯片启望S3及超节点方案、推理云计划。这是曦望完成约30亿元融资后的首次技术亮相。与行业普遍的‘训推一体’路线不同,S3专注于推理效率和单位成本,采用LPDDR6显存方案,显存容量提升4倍,单位Token推理成本下降约90%。曦望还推出面向大模型推理的寰望SC3超节点解决方案,支持单域256卡互联,交付成本从亿元级降至千万元级,并兼容CUDA软件体系。此外,曦望联合生态伙伴探索推理云平台,通过GPU池化与弹性调度降低企业使用门槛,推动‘百万Token一分钱’目标实现。董事长徐冰表示,持续降低推理成本是掌握AI产业成本曲线的关键。
原文链接
推理成本降至1元/每百万token,浪潮信息突破AI规模化瓶颈
允中 发自 凹非寺
量子位 | 公众号 QbitAI
全球AI产业已从模型性能竞争转向智能体规模化落地的关键阶段,“降本”成为决定AI企业盈利与行业突破的核心。在此背景下,浪潮信息推出元脑HC1000超扩展AI服务器,将推理成本首次...
原文链接
9月27日,2025人工智能计算大会在北京举行,聚焦AI基础设施与算力优化。会上,中国移动等30多家机构联合发布《智算应用“北京方案”》。专家指出,token成本高成为AI应用规模化的瓶颈,尤其在客服、推荐等场景中,企业面临盈利压力。浪潮信息推出元脑HC1000服务器,通过硬件创新将推理成本降至1元/每百万token,并提升性能1.75倍。业内人士强调,AI产业正从模型竞赛转向应用落地,基础设施的降本增效将是关键。
原文链接
加载更多
暂无内容