1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

【Cerebras Systems发布全球最快AI推理解决方案】8月28日,Cerebras Systems宣布推出全新AI推理解决方案——Cerebras Inference,此方案在性能上超越了当前市场上的主流AI推理解决方案,速度达到了英伟达同类方案的20倍。针对Llama 3.1 8B和70B模型,Cerebras Inference分别实现了每秒1800个token和450个token的处理能力,展现出卓越的效能。此外,这款解决方案的定价极具竞争力,仅为每百万个token 10美分,相比市面上流行的GPU云服务,性价比提高了100倍。Cerebras Inference采用Cerebras CS-3系统及Wafer Scale Engine 3(AI处理器),内存带宽达到Nvidia H100的7000倍,有效解决了生成式AI的内存带宽问题。为了满足不同用户的需求,Cerebras Inference提供了包括免费层、开发者层和企业层在内的三个层级服务,旨在为AI应用程序开发者提供更高效、更经济的AI应用构建环境。Cerebras团队表示,Cerebras Inference以其创纪录的性能、业界领先的定价和开放的API访问,为开放的LLM开发和部署设定了新标准,并为AI领域带来了新的可能性。随着AI市场的快速发展,Cerebras和Groq等新兴公司正挑战英伟达在AI市场的主导地位,尤其是推理领域的竞争日益激烈。

原文链接
本文链接:https://kx.umi6.com/article/5511.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
等效 5000 万块英伟达 H100 GPU,马斯克公布 xAI 五年算力目标
2025-07-23 09:46:53
AI芯片,再一次开战
2024-08-30 08:02:01
英伟达GPU被曝严重漏洞,致模型准确率暴跌99.9%
2025-07-23 15:52:55
马斯克在直播中首次披露Grok 3的训练成本:20万块英伟达GPU
2025-02-18 15:36:11
中国AI长卷(一):大国重算
2024-07-24 18:40:53
马斯克详谈AI5芯片:由三星和台积电一起生产,不会弃用英伟达GPU!
2025-10-23 10:06:47
SK电信将在首尔开设AI数据中心 全部配套英伟达GPU
2024-08-21 18:15:30
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
2025-09-29 15:09:28
苹果AI大模型“牵手”谷歌TPU,英伟达感受到威胁了吗?
2024-07-30 20:21:43
Cerebras 推出全球最快 AI 推理解决方案,速度是英伟达方案的 20 倍
2024-08-28 11:14:44
训练一次经历 419 次意外故障,英伟达 GPU 也差点玩不转 405B 模型,全靠 Meta 工程师后天救场
2024-07-29 17:06:39
中国AI芯片维修需求暴增 有商家月修500块英伟达高端GPU
2025-07-25 12:22:34
郭明錤:传言中苹果购买英伟达GPU短期内不会带来AI优势
2025-04-01 14:28:52
24小时热文
更多
扫一扫体验小程序