TileLang - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

连英伟达都开始抄作业，国内 AI 的野路子有点猛

2026年初，英伟达推出名为CUDA Tile的GPU编程语言，被业内认为是向中国技术‘取经’。此前，2024年一个中国团队开发了类似的TileLang语言，其高效性和跨平台特性引发关注。TileLang通过简化线程调度和数据复用，大幅提升开发效率与性能，减少了对英伟达硬件的依赖。英伟达此举被视为应对国内技术创新压力的举措，试图重新掌控GPU编程生态。然而，TileLang因不绑定特定硬件，仍具独特优势，为开发者提供了更多选择。这一趋势表明，开放技术路线正逐步挑战传统垄断地位，类似DirectX与Vulkan的竞争或将重现。

原文链接

神经网络领航员

01-14 11:30:26

CUDA Tile

GPU编程

TileLang

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek新模型上线

2025年9月30日，DeepSeek发布最新模型DeepSeek-V3.2-Exp，引入全新稀疏注意力机制DeepSeek Sparse Attention（DSA），显著提升长文本处理效率与推理性能，同时开源TileLang和CUDA双版本GPU算子，便于社区研究与迭代。官方App、网页端、小程序均已同步更新，并推出API 5折起优惠活动。此外，DeepSeek-V3.2-Exp在多项公开测评中表现与前代V3.1-Terminus持平，但在处理128K长上下文时成本更低。同日，智谱GLM-4.6也被曝光正在开发中，其上一代旗舰GLM-4.5已标注为旧版。国庆前夕，AI领域竞争愈发激烈。

原文链接

AI幻想空间站

09-30 11:25:43

DeepSeek

TileLang

稀疏注意力机制

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配

2025年9月30日，DeepSeek v3.2发布引发关注，其开源TileLang版本算子成为焦点。TileLang是一种对标CUDA的领域专用语言，专为GPU内核开发设计，性能优越且代码简洁，仅需不到100行即可实现比Flash Attention 2快30%的注意力机制。华为昇腾在第一时间适配TileLang，彰显其与国产算力生态的紧密合作。TileLang由北大团队主导开发，于2025年1月开源，目前GitHub标星达1.9k。DeepSeek团队利用TileLang快速迭代和优化性能，验证了其在模型训练中的实用性。此次双向合作被视为推动国产GPU语言发展的重要一步。

原文链接

DreamCoder

09-30 10:23:35

DeepSeek

GPU

TileLang

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek新模型上线！引入DSA新稀疏注意力，还又狙了CUDA一枪

2025年9月29日，DeepSeek发布最新模型DeepSeek-V3.2-Exp，引入全新稀疏注意力机制DSA，显著提升长文本处理效率与推理性能。官方同步开源TileLang和CUDA双版本GPU算子，并推出API 5折优惠活动。新模型基于上周发布的V3.1-Terminus改进，在稳定性及工具调用能力上进一步优化，尤其在128K长上下文推理中成本更低。此外，智谱AI的GLM-4.6模型也在开发中，其官网已将GLM-4.5标记为‘上一代旗舰’。国庆期间将迎来一波AI技术更新热潮，开发者可关注相关资源链接获取更多信息。

原文链接