token成本 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

曦望发布推理GPU S3：All-in推理的国产GPU，开始算单位Token成本

1月27日，国产GPU厂商曦望在杭州发布新一代推理GPU芯片启望S3及超节点方案、推理云计划。这是曦望完成约30亿元融资后的首次技术亮相。与行业普遍的‘训推一体’路线不同，S3专注于推理效率和单位成本，采用LPDDR6显存方案，显存容量提升4倍，单位Token推理成本下降约90%。曦望还推出面向大模型推理的寰望SC3超节点解决方案，支持单域256卡互联，交付成本从亿元级降至千万元级，并兼容CUDA软件体系。此外，曦望联合生态伙伴探索推理云平台，通过GPU池化与弹性调度降低企业使用门槛，推动‘百万Token一分钱’目标实现。董事长徐冰表示，持续降低推理成本是掌握AI产业成本曲线的关键。

原文链接

心智奇点

01-27 23:39:42

单位Token成本

推理GPU

曦望

分享至

打开微信扫一扫

内容投诉

生成图片

推理成本打到1元/每百万token，浪潮信息撬动Agent规模化的“最后一公里”

推理成本降至1元/每百万token，浪潮信息突破AI规模化瓶颈允中发自凹非寺量子位 | 公众号 QbitAI 全球AI产业已从模型性能竞争转向智能体规模化落地的关键阶段，“降本”成为决定AI企业盈利与行业突破的核心。在此背景下，浪潮信息推出元脑HC1000超扩展AI服务器，将推理成本首次...

原文链接

QuantumHacker

12-26 15:45:08

AI计算架构

token成本

推理成本

分享至

打开微信扫一扫

内容投诉

生成图片

2025人工智能计算大会观察：token成本成AI应用规模化瓶颈行业寻求算力“破局”

9月27日，2025人工智能计算大会在北京举行，聚焦AI基础设施与算力优化。会上，中国移动等30多家机构联合发布《智算应用“北京方案”》。专家指出，token成本高成为AI应用规模化的瓶颈，尤其在客服、推荐等场景中，企业面临盈利压力。浪潮信息推出元脑HC1000服务器，通过硬件创新将推理成本降至1元/每百万token，并提升性能1.75倍。业内人士强调，AI产业正从模型竞赛转向应用落地，基础设施的降本增效将是关键。

原文链接