综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
1月27日,国产GPU厂商曦望在杭州发布新一代推理GPU芯片启望S3及超节点方案、推理云计划。这是曦望完成约30亿元融资后的首次技术亮相。与行业普遍的‘训推一体’路线不同,S3专注于推理效率和单位成本,采用LPDDR6显存方案,显存容量提升4倍,单位Token推理成本下降约90%。曦望还推出面向大模型推理的寰望SC3超节点解决方案,支持单域256卡互联,交付成本从亿元级降至千万元级,并兼容CUDA软件体系。此外,曦望联合生态伙伴探索推理云平台,通过GPU池化与弹性调度降低企业使用门槛,推动‘百万Token一分钱’目标实现。董事长徐冰表示,持续降低推理成本是掌握AI产业成本曲线的关键。
原文链接
加载更多
暂无内容