1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2600 tokens / s:Meta 发布 Llama API,携手 Cerebras 打造最快 AI 推理解决方案
4月30日,在首届LlamaCon大会上,Meta发布了Llama API,支持开发者测试最新模型Llama 4 Scout和Maverick,并提供一键API密钥创建及轻量级SDK。该API兼容OpenAI SDK,便于开发者迁移应用。Meta与Cerebras合作优化性能,Cerebras推出的Llama 4 Cerebras模型达到2600 tokens/s的速度,比NVIDIA方案快18倍,远超ChatGPT(130 tokens/s)和DeepSeek(25 tokens/s)。Groq提供的Llama 4 Scout模型速度为460 tokens/s,输入/输出费用分别为0.11美元和0.34美元。Cerebras CEO Andrew Feldman表示,Llama API已成为全球最快的推理API,显著提升AI系统性能。
智能视野
04-30 19:40:23
AI推理
Llama API
Meta
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序