推理系统 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

SGLang原生支持昇腾，新模型一键拉起无需改代码

12月20日，SGLang AI金融π对在杭州举办，聚焦大模型推理效率问题。活动中，昇腾作为算力平台被多次提及，现已原生支持SGLang推理引擎，DeepSeek、Qwen等模型可直接运行无需修改代码。SGLang通过HiCache、Mooncake等系统能力优化高并发、长上下文推理场景，并显著提升强化学习效率。昇腾与SGLang深度共建，优化覆盖多模态生成、量化及图模式支持，实现高性能推理。活动还展示了昇腾在真实业务场景中的灰度测试成果，未来将围绕推理系统持续投入，构建开源生态协作能力，推动AI算力规模化稳定运行。

原文链接

虚拟织梦者

12-21 23:08:38

SGLang

推理系统

昇腾

分享至

打开微信扫一扫

内容投诉

生成图片

高通机架级 AI 推理系统获沙特订单，HUMAIN 将部署 200MW

10月28日，高通在沙特阿拉伯首都利雅得宣布与沙特主权财富基金PIF旗下AI企业HUMAIN达成合作。根据协议，HUMAIN将从2026年起部署200MW容量的高通AI200和AI250机架级AI推理系统，构建全球首个优化的边缘到云混合AI解决方案。双方将整合HUMAIN自主研发的AI ALLaM模型与高通AI平台，推动沙特引领AI创新，并为全球企业与政府提供定制化AI服务。此前，高通发布的AI芯片曾推动其股价上涨超20%。

原文链接

灵感Phoenix

11-02 11:19:59

AI推理系统

沙特

高通

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek首次披露：理论成本利润率545%

3月1日，DeepSeek发布文章《DeepSeek-V3/R1 推理系统概览》，首次公开其理论成本和利润率。文中指出，假设GPU租赁成本为2美元/小时，DeepSeek V3/R1的日总成本为87072美元。若按DeepSeek R1定价计算，日总收入可达562027美元，从而实现高达545%的成本利润率。

原文链接

未来笔触

03-01 17:04:18

DeepSeek

成本利润率

推理系统

分享至

打开微信扫一扫

内容投诉

生成图片

官方详解 DeepSeek-V3 / R1 推理系统：优化目标是更大吞吐、更低延迟

DeepSeek官方在3月1日于知乎发布文章，详解DeepSeek-V3/R1推理系统。该系统旨在实现更大吞吐和更低延迟。通过大规模跨节点专家并行(EP)技术，系统优化了批处理大小，提高了传输效率。计算通信重叠技术进一步降低了延迟。此外，负载均衡策略确保了各GPU的均衡工作量。据统计，在2025年2月27日12:00至28日12:00期间，系统峰值占用278个节点，平均占用226.75个节点。系统每秒处理约73.7k输入tokens，14.8k输出tokens，总收入理论可达$562,027/天。

原文链接

GhostPilot

03-01 13:58:32

DeepSeek-V3/R1

推理系统

负载均衡

分享至

打开微信扫一扫

内容投诉

生成图片

实测豆包1.5后，看到了字节不走捷径的底气

2025年1月，豆包大模型1.5上线火山方舟，其通用模型pro在多个测评中综合得分优于GPT4o、Claude 3.5 Sonnet等模型，性能与推理成本达到极致平衡。采用MoE模型结构，性能提升7倍，推理延迟低至10毫秒。豆包大模型1.5在知识、代码、推理及中文能力上均有显著增强，综合得分领先。...

原文链接