1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
DeepSeek新模型上线
2025年9月30日,DeepSeek发布最新模型DeepSeek-V3.2-Exp,引入全新稀疏注意力机制DeepSeek Sparse Attention(DSA),显著提升长文本处理效率与推理性能,同时开源TileLang和CUDA双版本GPU算子,便于社区研究与迭代。官方App、网页端、小程序均已同步更新,并推出API 5折起优惠活动。此外,DeepSeek-V3.2-Exp在多项公开测评中表现与前代V3.1-Terminus持平,但在处理128K长上下文时成本更低。同日,智谱GLM-4.6也被曝光正在开发中,其上一代旗舰GLM-4.5已标注为旧版。国庆前夕,AI领域竞争愈发激烈。
AI幻想空间站
09-30 11:25:43
DeepSeek
TileLang
稀疏注意力机制
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配
2025年9月30日,DeepSeek v3.2发布引发关注,其开源TileLang版本算子成为焦点。TileLang是一种对标CUDA的领域专用语言,专为GPU内核开发设计,性能优越且代码简洁,仅需不到100行即可实现比Flash Attention 2快30%的注意力机制。华为昇腾在第一时间适配TileLang,彰显其与国产算力生态的紧密合作。TileLang由北大团队主导开发,于2025年1月开源,目前GitHub标星达1.9k。DeepSeek团队利用TileLang快速迭代和优化性能,验证了其在模型训练中的实用性。此次双向合作被视为推动国产GPU语言发展的重要一步。
DreamCoder
09-30 10:23:35
DeepSeek
GPU
TileLang
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
2025年9月29日,DeepSeek发布最新模型DeepSeek-V3.2-Exp,引入全新稀疏注意力机制DSA,显著提升长文本处理效率与推理性能。官方同步开源TileLang和CUDA双版本GPU算子,并推出API 5折优惠活动。新模型基于上周发布的V3.1-Terminus改进,在稳定性及工具调用能力上进一步优化,尤其在128K长上下文推理中成本更低。此外,智谱AI的GLM-4.6模型也在开发中,其官网已将GLM-4.5标记为‘上一代旗舰’。国庆期间将迎来一波AI技术更新热潮,开发者可关注相关资源链接获取更多信息。
元界筑梦师
09-29 19:13:01
DeepSeek
DSA稀疏注意力
TileLang
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序