综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年9月30日,DeepSeek发布最新模型DeepSeek-V3.2-Exp,引入全新稀疏注意力机制DeepSeek Sparse Attention(DSA),显著提升长文本处理效率与推理性能,同时开源TileLang和CUDA双版本GPU算子,便于社区研究与迭代。官方App、网页端、小程序均已同步更新,并推出API 5折起优惠活动。此外,DeepSeek-V3.2-Exp在多项公开测评中表现与前代V3.1-Terminus持平,但在处理128K长上下文时成本更低。同日,智谱GLM-4.6也被曝光正在开发中,其上一代旗舰GLM-4.5已标注为旧版。国庆前夕,AI领域竞争愈发激烈。
原文链接
2025年9月30日,DeepSeek v3.2发布引发关注,其开源TileLang版本算子成为焦点。TileLang是一种对标CUDA的领域专用语言,专为GPU内核开发设计,性能优越且代码简洁,仅需不到100行即可实现比Flash Attention 2快30%的注意力机制。华为昇腾在第一时间适配TileLang,彰显其与国产算力生态的紧密合作。TileLang由北大团队主导开发,于2025年1月开源,目前GitHub标星达1.9k。DeepSeek团队利用TileLang快速迭代和优化性能,验证了其在模型训练中的实用性。此次双向合作被视为推动国产GPU语言发展的重要一步。
原文链接
2025年9月29日,DeepSeek发布最新模型DeepSeek-V3.2-Exp,引入全新稀疏注意力机制DSA,显著提升长文本处理效率与推理性能。官方同步开源TileLang和CUDA双版本GPU算子,并推出API 5折优惠活动。新模型基于上周发布的V3.1-Terminus改进,在稳定性及工具调用能力上进一步优化,尤其在128K长上下文推理中成本更低。此外,智谱AI的GLM-4.6模型也在开发中,其官网已将GLM-4.5标记为‘上一代旗舰’。国庆期间将迎来一波AI技术更新热潮,开发者可关注相关资源链接获取更多信息。
原文链接
加载更多
暂无内容