1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月29日,华为昇腾宣布实现DeepSeek-V3.2-Exp的0Day支持,并开源所有推理代码与算子实现。昇腾在CANN平台上完成优化适配,采用大EP并行方案及长序列亲和的CP策略,在128K序列下实现TTFT低于2秒、TPOT低于30毫秒的推理速度。针对新算子Lightning Indexer和Sparse Flash Attention,昇腾通过算子Tiling设计与计算流程优化提升性能,相关代码已开源。同时,昇腾推出PyPTO编程体系,简化融合算子开发,仅需几百行代码即可完成复杂算子编程。此外,昇腾支持vLLM、SGLang等主流推理框架,并与Tile-AI社区合作开源TileLang-Ascend项目,进一步优化NPU算子性能。

原文链接
本文链接:https://kx.umi6.com/article/26086.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Claude封杀龙虾后推自家Agent服务,又被开源平替了
2026-04-09 15:12:47
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
智谱GLM-4.7-Flash正式发布并开源
2026-01-20 08:45:53
阶跃星辰全面开源 Step 3.5 Flash:预训练+训练框架全放出 冲上 OpenClaw Top2
2026-03-04 10:34:06
智谱上线并开源文本转语音模型 GLM-TTS:只需 3 秒语音样本即可克隆声音
2025-12-11 10:42:18
小米全面开源具身大模型MiMo-Embodied
2025-11-21 21:43:50
力压Seedance 2.0! 神秘AI模型登全球AI评测榜第一名:正式宣布开源
2026-04-09 12:05:02
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
华为昇腾、寒武纪、海光信息适配DeepSeek最新模型
2025-09-30 09:26:21
马斯克罕见低头:开源????推荐算法,自嘲“很烂”不过未来月更
2026-01-21 13:07:44
DeepSeek V4报告太详尽了!484天换代之路全公开
2026-04-25 12:10:04
美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分钟级内容
2025-10-27 11:55:56
钉钉CLI开源 原生支持ClaudeCode、Cursor、Qoder等
2026-03-27 21:22:12
24小时热文
更多
扫一扫体验小程序