哈佛辍学华人创办的初创公司Etched发布了首款大模型专用芯片Sohu,宣称一张芯片可顶20张H100,性能超越英伟达下一代芯片GB200。Sohu专为Transformer算法设计,拥有700亿参数的高吞吐量,已完成1.2亿美元融资。尽管面临Transformer架构可能被新架构取代的风险,但Etched认为其芯片将因Transformer的广泛使用而有价值。Sohu采用4nm工艺,支持大模型推理,包括MoE架构和多种Transformer变体。芯片已在云端开放抢先体验,未来可能影响实时语音客服、代码优化和文本生成等领域。然而,GPU效率提升缓慢的质疑和Transformer后继技术的不确定性引发了行业讨论。
原文链接
本文链接:https://kx.umi6.com/article/2124.html
转载请注明文章出处
相关推荐
换一换
英伟达 4B 小模型击败 GPT-5 Pro!单任务成本仅后者 1/36
2025-12-08 16:36:14
中国AI芯片市场迎巨变:英伟达2026年将仅占8%
2025-12-05 12:26:55
联想与英伟达合作打造吉瓦级 AI 工厂,杨元庆、黄仁勋同台亮相
2026-01-07 10:59:33
英伟达数千亿现金流将用于何处?黄仁勋:自身增长、股票回购和投资
2025-11-20 10:22:59
AI芯片竞赛升级!Meta据悉转向谷歌TPU 英伟达“王位”不稳?
2025-11-25 17:01:10
黄仁勋「收购式」抢人继续
2026-01-01 19:30:34
英伟达CEO黄仁勋:未来十年世界上大部分汽车将实现自动驾驶或高度自动驾驶
2026-01-06 15:13:14
卡特彼勒与英伟达扩大合作
2026-01-08 08:01:03
10 万亿 tokens!英伟达贡献全球最大规模开源数据集,并推四大开源 AI 模型
2026-01-06 06:48:15
鸿海与英伟达合建的 140 亿美元超级计算中心将于 2026 年上半年完工
2025-11-23 14:09:20
黄仁勋:物理 AI 的 ChatGPT 时刻,快到了
2026-01-06 19:30:39
美银力挺英伟达:到2030年仍将主导市场 但市场份额或略微下滑
2025-11-27 09:29:20
Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能较 HGX 200 提升 10 倍
2025-12-04 12:20:54
625 文章
419978 浏览
24小时热文
更多
-
2026-01-08 23:40:43 -
2026-01-08 23:37:36 -
2026-01-08 22:36:23