1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

12月20日,SGLang AI金融π对在杭州举办,聚焦大模型推理效率问题。活动中,昇腾作为算力平台被多次提及,现已原生支持SGLang推理引擎,DeepSeek、Qwen等模型可直接运行无需修改代码。SGLang通过HiCache、Mooncake等系统能力优化高并发、长上下文推理场景,并显著提升强化学习效率。昇腾与SGLang深度共建,优化覆盖多模态生成、量化及图模式支持,实现高性能推理。活动还展示了昇腾在真实业务场景中的灰度测试成果,未来将围绕推理系统持续投入,构建开源生态协作能力,推动AI算力规模化稳定运行。

原文链接
本文链接:https://kx.umi6.com/article/30579.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
2秒吃透一道高数大题!华为揭秘7180亿参数昇腾大模型
2025-05-30 13:50:18
鸿蒙、麒麟、昇腾齐亮相 第二十七届高交会聚焦科技创新
2025-11-05 16:16:46
AMD:已将 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上,利用 SGLang 彻底改变 AI 开发
2025-01-25 18:01:34
DeepSeek首次披露:理论成本利润率545%
2025-03-01 17:04:18
华为高管:昇腾 AI 算力性能已超英伟达 A100,近半中国大模型选择昇腾技术路线
2024-06-19 13:46:44
Bye,英伟达!华为NPU,跑出了准万亿参数大模型
2025-05-08 13:29:25
华为高管:昇腾AI算力性能已超过英伟达A100
2024-06-18 13:30:42
零一万物与华为启动合作,将基于昇腾硬件底座开发原生大模型应用
2024-11-13 16:45:41
新致软件与华为签署协议深化昇腾AI合作 即将于WAIC期间发布大模型原生开发成果
2024-06-28 15:48:07
官方详解 DeepSeek-V3 / R1 推理系统:优化目标是更大吞吐、更低延迟
2025-03-01 13:58:32
首个开源实现100%可复现的稳定RL训练框架来了!2次结果完全重合
2025-09-27 11:40:10
SGLang原生支持昇腾,新模型一键拉起无需改代码
2025-12-21 23:08:38
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026
2025-12-21 10:35:20
24小时热文
更多
扫一扫体验小程序