9月29日,华为昇腾宣布实现DeepSeek-V3.2-Exp的0Day支持,并开源所有推理代码与算子实现。昇腾在CANN平台上完成优化适配,采用大EP并行方案及长序列亲和的CP策略,在128K序列下实现TTFT低于2秒、TPOT低于30毫秒的推理速度。针对新算子Lightning Indexer和Sparse Flash Attention,昇腾通过算子Tiling设计与计算流程优化提升性能,相关代码已开源。同时,昇腾推出PyPTO编程体系,简化融合算子开发,仅需几百行代码即可完成复杂算子编程。此外,昇腾支持vLLM、SGLang等主流推理框架,并与Tile-AI社区合作开源TileLang-Ascend项目,进一步优化NPU算子性能。
原文链接
本文链接:https://kx.umi6.com/article/26086.html
转载请注明文章出处
相关推荐
换一换
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
企业级OpenClaw最强拍档来了!万亿参数的国产多模态大模型,刚刚开源发布
2026-03-05 19:45:14
兑现承诺!马斯克旗下xAI宣布Grok 2.5正式开源
2025-08-25 16:33:11
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
华为UCM推理记忆管理技术正式开源
2025-11-05 16:17:45
这么哇塞的世界模型,竟然是开源的!
2026-01-29 17:29:59
北京人形机器人创新中心开源Pelican-VL 1.0模型
2025-11-13 21:24:03
DeepSeek-V3.2-Exp发布并开源
2025-09-29 18:14:47
华为昇腾 AI 生态开发者数量达 400 万 +,发展合作伙伴 3000+
2026-01-09 13:17:18
商汤大装置与华为昇腾 384 超节点全面适配,多项创新提升训练效率
2025-09-06 14:35:21
开源炸场!优必选具身智能大模型Thinker再次狂揽9项全球第一!
2026-02-02 11:31:14
英伟达一口气开源多项机器人技术,与迪士尼合作的物理引擎也开源
2025-10-02 12:10:18
英伟达开源 9B 参数 AI 小模型 Nemotron Nano v2,比 Qwen3 快 6 倍
2025-08-19 15:01:14
629 文章
432779 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18