1月27日,国产GPU厂商曦望在杭州发布新一代推理GPU芯片启望S3及超节点方案、推理云计划。这是曦望完成约30亿元融资后的首次技术亮相。与行业普遍的‘训推一体’路线不同,S3专注于推理效率和单位成本,采用LPDDR6显存方案,显存容量提升4倍,单位Token推理成本下降约90%。曦望还推出面向大模型推理的寰望SC3超节点解决方案,支持单域256卡互联,交付成本从亿元级降至千万元级,并兼容CUDA软件体系。此外,曦望联合生态伙伴探索推理云平台,通过GPU池化与弹性调度降低企业使用门槛,推动‘百万Token一分钱’目标实现。董事长徐冰表示,持续降低推理成本是掌握AI产业成本曲线的关键。
原文链接
本文链接:https://kx.umi6.com/article/32244.html
转载请注明文章出处
相关推荐
换一换
曦望发布推理GPU S3:All-in推理的国产GPU,开始算单位Token成本
2026-01-27 23:39:42
新国产GPU「曦望」,刚融了10个亿
2025-06-30 18:45:32
AI推理GPU芯片公司曦望完成近30亿元融资
2026-01-22 16:05:02
马斯克冲刺机器人量产,果断停产特斯拉豪华车型!2026年资本支出将“非常大”
2026-01-29 11:11:07
Clawdbot 爆火以后,这条硬件赛道成了最大受益者
2026-01-30 13:33:11
存储巨头的万亿赌局
2026-01-29 11:18:04
中信证券:海外AI叙事或重回乐观情形
2026-01-30 09:17:16
这么哇塞的世界模型,竟然是开源的!
2026-01-29 17:29:59
微软股价盘后大跌 支出创纪录新高且云业务增长放缓
2026-01-29 08:06:53
硅谷2026开年重磅:全球顶尖科学家与产业领袖巅峰对话,预演AI+科学未来十年
2026-01-30 13:26:15
登顶行业SOTA的多模态视频生成标杆,昆仑天工刚给开源了
2026-01-29 17:31:27
TTC完成A轮千万美元融资,厚雪资本领投、百度战略投资
2026-01-30 13:38:58
Trooly.AI完成近千万美元种子轮融资
2026-01-30 13:48:19
598 文章
385664 浏览
24小时热文
更多
-
2026-01-31 08:21:23 -
2026-01-31 08:20:32 -
2026-01-30 22:53:26