1月27日,国产GPU厂商曦望在杭州发布新一代推理GPU芯片启望S3及超节点方案、推理云计划。这是曦望完成约30亿元融资后的首次技术亮相。与行业普遍的‘训推一体’路线不同,S3专注于推理效率和单位成本,采用LPDDR6显存方案,显存容量提升4倍,单位Token推理成本下降约90%。曦望还推出面向大模型推理的寰望SC3超节点解决方案,支持单域256卡互联,交付成本从亿元级降至千万元级,并兼容CUDA软件体系。此外,曦望联合生态伙伴探索推理云平台,通过GPU池化与弹性调度降低企业使用门槛,推动‘百万Token一分钱’目标实现。董事长徐冰表示,持续降低推理成本是掌握AI产业成本曲线的关键。
原文链接
本文链接:https://kx.umi6.com/article/32244.html
转载请注明文章出处
相关推荐
换一换
新国产GPU「曦望」,刚融了10个亿
2025-06-30 18:45:32
AI推理GPU芯片公司曦望完成近30亿元融资
2026-01-22 16:05:02
Nature封面:机器人乒乓球干翻人类职业选手
2026-04-23 15:11:01
AI太烧钱!Meta裁员8000人再冻6000职位
2026-04-24 16:19:57
贝莱德全球首席投资策略师称在人工智能热潮中看好半导体和硬件股
2026-04-24 23:43:31
河南师傅,左手扳手,右手飞书,竟然能搞数据分析!
2026-04-23 23:34:55
多重利好催化 AI硬件开启消费电子新成长周期
2026-04-23 06:53:08
阶跃StepAudio 2.5 ASR上线 支持500TPS极速推理
2026-04-24 14:19:56
挖漏洞何必Mythos,国产智能体早跑通了
2026-04-23 08:53:48
仅靠219个字!AI耗时12小时设计出完整CPU:传统研发需18-36个月
2026-04-24 17:26:33
斑马智能接入支付宝AI付车载版 打通AI座舱“支付即服务”
2026-04-24 17:25:23
DeepSeek V4终于发布!打破最强闭源垄断,明确携手华为芯片
2026-04-24 13:09:49
中信证券:预计二季度AI行情开始发散 建议关注被动元件、消费电子等细分板块
2026-04-24 09:04:28
665 文章
516524 浏览
24小时热文
更多
-
2026-04-25 00:42:43 -
2026-04-24 23:43:31 -
2026-04-24 23:42:26