Llama API - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

2600 tokens / s：Meta 发布 Llama API，携手 Cerebras 打造最快 AI 推理解决方案

4月30日，在首届LlamaCon大会上，Meta发布了Llama API，支持开发者测试最新模型Llama 4 Scout和Maverick，并提供一键API密钥创建及轻量级SDK。该API兼容OpenAI SDK，便于开发者迁移应用。Meta与Cerebras合作优化性能，Cerebras推出的Llama 4 Cerebras模型达到2600 tokens/s的速度，比NVIDIA方案快18倍，远超ChatGPT（130 tokens/s）和DeepSeek（25 tokens/s）。Groq提供的Llama 4 Scout模型速度为460 tokens/s，输入/输出费用分别为0.11美元和0.34美元。Cerebras CEO Andrew Feldman表示，Llama API已成为全球最快的推理API，显著提升AI系统性能。

原文链接