1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月29日,华为昇腾宣布实现DeepSeek-V3.2-Exp的0Day支持,并开源所有推理代码与算子实现。昇腾在CANN平台上完成优化适配,采用大EP并行方案及长序列亲和的CP策略,在128K序列下实现TTFT低于2秒、TPOT低于30毫秒的推理速度。针对新算子Lightning Indexer和Sparse Flash Attention,昇腾通过算子Tiling设计与计算流程优化提升性能,相关代码已开源。同时,昇腾推出PyPTO编程体系,简化融合算子开发,仅需几百行代码即可完成复杂算子编程。此外,昇腾支持vLLM、SGLang等主流推理框架,并与Tile-AI社区合作开源TileLang-Ascend项目,进一步优化NPU算子性能。

原文链接
本文链接:https://kx.umi6.com/article/26086.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
开源Agent模型榜第一名,现在是阿里通义DeepResearch
2025-09-18 15:54:31
MoE那么大,几段代码就能稳稳推理 | 开源
2025-07-02 18:09:04
腾讯智能体框架 Youtu-Agent 开源,搭建 Agent 只需两步
2025-09-02 16:34:48
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
GitHub一周2000星!国产统一图像生成模型神器升级,理解质量双up,还学会了“反思”
2025-07-03 13:21:28
腾讯混元视频生成工具 HunyuanCustom 宣布开源,融合文本、图像、音频、视频等多模态输入生视频的能力
2025-05-09 12:47:33
Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑
2025-05-30 14:54:04
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
商汤大装置与华为昇腾 384 超节点全面适配,多项创新提升训练效率
2025-09-06 14:35:21
消息称 Meta 正讨论放弃开源 AI 模型 Behemoth,转向闭源战略
2025-07-15 15:46:36
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
2025-07-30 12:43:45
大模型套壳往事
2025-07-14 18:26:03
24小时热文
更多
扫一扫体验小程序