1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

【Cerebras Systems发布全球最快AI推理解决方案】8月28日,Cerebras Systems宣布推出全新AI推理解决方案——Cerebras Inference,此方案在性能上超越了当前市场上的主流AI推理解决方案,速度达到了英伟达同类方案的20倍。针对Llama 3.1 8B和70B模型,Cerebras Inference分别实现了每秒1800个token和450个token的处理能力,展现出卓越的效能。此外,这款解决方案的定价极具竞争力,仅为每百万个token 10美分,相比市面上流行的GPU云服务,性价比提高了100倍。Cerebras Inference采用Cerebras CS-3系统及Wafer Scale Engine 3(AI处理器),内存带宽达到Nvidia H100的7000倍,有效解决了生成式AI的内存带宽问题。为了满足不同用户的需求,Cerebras Inference提供了包括免费层、开发者层和企业层在内的三个层级服务,旨在为AI应用程序开发者提供更高效、更经济的AI应用构建环境。Cerebras团队表示,Cerebras Inference以其创纪录的性能、业界领先的定价和开放的API访问,为开放的LLM开发和部署设定了新标准,并为AI领域带来了新的可能性。随着AI市场的快速发展,Cerebras和Groq等新兴公司正挑战英伟达在AI市场的主导地位,尤其是推理领域的竞争日益激烈。

原文链接
本文链接:https://kx.umi6.com/article/5511.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
苹果AI大模型“牵手”谷歌TPU,英伟达感受到威胁了吗?
2024-07-30 20:21:43
等效 5000 万块英伟达 H100 GPU,马斯克公布 xAI 五年算力目标
2025-07-23 09:46:53
AI芯片,再一次开战
2024-08-30 08:02:01
郭明錤:传言中苹果购买英伟达GPU短期内不会带来AI优势
2025-04-01 14:28:52
中国AI芯片维修需求暴增 有商家月修500块英伟达高端GPU
2025-07-25 12:22:34
SK电信将在首尔开设AI数据中心 全部配套英伟达GPU
2024-08-21 18:15:30
训练一次经历 419 次意外故障,英伟达 GPU 也差点玩不转 405B 模型,全靠 Meta 工程师后天救场
2024-07-29 17:06:39
Cerebras 推出全球最快 AI 推理解决方案,速度是英伟达方案的 20 倍
2024-08-28 11:14:44
中国AI长卷(一):大国重算
2024-07-24 18:40:53
英伟达GPU,警钟敲响
2024-07-07 09:29:20
马斯克在直播中首次披露Grok 3的训练成本:20万块英伟达GPU
2025-02-18 15:36:11
英伟达GPU被曝严重漏洞,致模型准确率暴跌99.9%
2025-07-23 15:52:55
支持百万卡扩展,中科曙光发布国内首个开放架构 AI 超集群系统
2025-09-05 21:25:03
24小时热文
更多
扫一扫体验小程序