AI芯片厂商Cerebras的CEOAndrewFeldman透露,公司因运行DeepSeek-R1大语言模型的订单过多而面临压力。DeepSeek-R1的预训练成本仅为主流模型的十分之一,且效果更好,被视作AI领域的分水岭。该模型部署在晶圆级AI芯片上,性能显著优于GPU。Cerebras采用蒸馏技术将大型模型的知识转移到小型模型,以提高用户体验。尽管有人担忧成本下降会导致市场萎缩,但历史表明降低成本反而能扩大市场容量。Cerebras自去年8月起提供公共推理服务,目前主要提供蒸馏后的70B模型,未来可能提供更多选择。
原文链接
本文链接:https://kx.umi6.com/article/13239.html
转载请注明文章出处
相关推荐
.png)
换一换
黄仁勋,告别魔咒?
2025-05-30 11:49:22
英特尔的AI芯片战略,变了?
2025-07-15 10:38:00
周鸿祎解读DeepSeek更新:中美AI实力已平起平坐
2025-06-09 17:33:29
450 文章
69314 浏览
24小时热文
更多

-
2025-07-20 20:08:46
-
2025-07-20 20:07:36
-
2025-07-20 19:08:20