1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月29日,华为昇腾宣布实现DeepSeek-V3.2-Exp的0Day支持,并开源所有推理代码与算子实现。昇腾在CANN平台上完成优化适配,采用大EP并行方案及长序列亲和的CP策略,在128K序列下实现TTFT低于2秒、TPOT低于30毫秒的推理速度。针对新算子Lightning Indexer和Sparse Flash Attention,昇腾通过算子Tiling设计与计算流程优化提升性能,相关代码已开源。同时,昇腾推出PyPTO编程体系,简化融合算子开发,仅需几百行代码即可完成复杂算子编程。此外,昇腾支持vLLM、SGLang等主流推理框架,并与Tile-AI社区合作开源TileLang-Ascend项目,进一步优化NPU算子性能。

原文链接
本文链接:https://kx.umi6.com/article/26086.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华为昇腾 384 超节点 Atlas 900 SuperPoD 被评选为本次 WAIC 2025 镇馆之宝
2025-07-28 12:10:28
马斯克罕见低头:开源????推荐算法,自嘲“很烂”不过未来月更
2026-01-21 13:07:44
小米全面开源具身大模型MiMo-Embodied
2025-11-21 21:43:50
腾讯智能体开源大动作!关键技术都拿出来了,开发平台还全面升级
2025-09-22 12:58:11
商汤开源空间智能大模型SenseNova-SI
2025-11-11 08:59:30
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分钟级内容
2025-10-27 11:55:56
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
华为昇腾在列!中国两大AI联盟成立:推动本土生态系、降低对美国依赖
2025-07-30 14:45:43
腾讯混元世界模型 1.1 版本发布并开源:单卡即可部署,秒级创造 3D 世界
2025-10-22 18:50:23
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
北京人形开源最新VLM模型,推动具身智能再迈关键一步 !
2025-11-14 13:57:27
Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……
2025-11-04 12:11:12
24小时热文
更多
扫一扫体验小程序