1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
九章云极率先完成DeepSeek-V3.2-Exp适配,提供安全高效部署方案
正文:2025年9月,九章云极宣布率先完成DeepSeek-V3.2-Exp大语言模型的适配,并在Alaya NeW智算云平台推出安全高效的私有化部署方案。该模型采用全新的稀疏注意力架构(DSA),显著降低长上下文计算成本,提升推理性能。通过一键化部署工具,企业可在自有环境中实现数据全链路隔离,保障核心业务信息安全。Alaya NeW平台提供多样化高端GPU资源与弹性调度功能,支持从单卡到千卡规模的灵活算力需求,覆盖训练、推理及微服务全流程。此次合作不仅推动AI技术普惠化,还助力企业大幅降低长序列文本场景下的训练推理成本,加速AI应用规模化落地。
智能涌动
09-30 16:29:13
DeepSeek-V3.2-Exp
九章云极
私有化部署
分享至
打开微信扫一扫
内容投诉
生成图片
华为昇腾、寒武纪、海光信息适配DeepSeek最新模型
9月29日,深度求索公司发布新一代大语言模型DeepSeek-V3.2-Exp,并在HuggingFace平台开源。该模型采用稀疏Attention架构,降低计算资源消耗并提升推理效率。华为昇腾、寒武纪、海光信息同步宣布完成适配:昇腾实现0day支持并开源推理代码;寒武纪适配后开源推理引擎vLLM-MLU,结合新机制大幅降低训推成本;海光信息实现无缝适配与深度调优,验证其DCU高性能及生态兼容性。三家企业以软硬件协同助力国产AI生态发展。
智慧棱镜
09-30 09:26:21
DeepSeek-V3.2-Exp
华为昇腾
寒武纪
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-V3.2-Exp第一时间上线华为云
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源,引入稀疏Attention架构以降低资源消耗、提升推理效率。华为云迅速完成适配,支持最长160K上下文序列,并将模型上架其大模型即服务平台MaaS,提供体验与API服务。华为云ModelArts推理平台基于CloudMatrix384基础设施,采用大EP并行方案优化部署,兼顾时延与吞吐性能,按需分配算力资源。用户可访问华为云官网,通过“大模型”导航菜单体验DeepSeek-V3.2-Exp模型的卓越能力。
虚拟织梦者
09-30 00:16:10
DeepSeek-V3.2-Exp
华为云
稀疏Attention架构
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek新发布
2025年9月29日,DeepSeek正式发布并开源实验性版本V3.2-Exp,引入稀疏注意力机制优化长文本处理效率。中信建投分析师评价其易用性大幅提升。此次更新同步上线官方App、网页端和小程序,API价格大幅降低,开发者调用成本减少超50%。同时,DeepSeek开源TileLang与CUDA双版本GPU算子,建议社区使用TileLang版本以加速研究迭代。TileLang由北大团队开发,显著减少代码量且性能持平。此外,阿里云发布七款大模型产品,包括Qwen3-Max;智谱GLM-4.6即将发布;月之暗面Kimi推出Agent模式“OK Computer”灰度测试,强化智能体能力。
AI创想团
09-29 22:15:21
API降价
DeepSeek-V3.2-Exp
稀疏注意力机制
分享至
打开微信扫一扫
内容投诉
生成图片
寒武纪Day 0适配DeepSeek-V3.2-Exp 同步开源推理引擎vLLM-MLU
9月29日,寒武纪通过官方微信号宣布,已完成对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并同步开源大模型推理引擎vLLM-MLU源代码。这一进展展示了寒武纪在人工智能领域的技术实力和开放生态布局,为开发者提供了更高效的推理工具支持。
星际Code流浪者
09-29 21:16:07
DeepSeek-V3.2-Exp
vLLM-MLU
寒武纪
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-V3.2-Exp官宣发布,API价格下调超50%
2025年9月29日,DeepSeek正式发布实验性版本V3.2-Exp,并开源。该版本引入稀疏注意力机制,优化长文本训练与推理效率,同时支持TileLang和CUDA两种GPU算子版本。API价格大幅下调,输入和输出成本降低超50%。中信建投分析师评价其易用性显著提升。官方表示,新模型在基准测试中表现与前代相当。此外,TileLang编程语言由北大团队开发,可大幅提升开发效率。同日,阿里云发布Qwen3-Max等七款大模型产品,智谱GLM-4.6即将上线,月之暗面Kimi推出Agent模式“OK Computer”灰度测试。
AGI探路者
09-29 20:15:06
API价格
DeepSeek-V3.2-Exp
稀疏注意力机制
分享至
打开微信扫一扫
内容投诉
生成图片
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
9月29日,华为昇腾宣布实现DeepSeek-V3.2-Exp的0Day支持,并开源所有推理代码与算子实现。昇腾在CANN平台上完成优化适配,采用大EP并行方案及长序列亲和的CP策略,在128K序列下实现TTFT低于2秒、TPOT低于30毫秒的推理速度。针对新算子Lightning Indexer和Sparse Flash Attention,昇腾通过算子Tiling设计与计算流程优化提升性能,相关代码已开源。同时,昇腾推出PyPTO编程体系,简化融合算子开发,仅需几百行代码即可完成复杂算子编程。此外,昇腾支持vLLM、SGLang等主流推理框架,并与Tile-AI社区合作开源TileLang-Ascend项目,进一步优化NPU算子性能。
心智奇点
09-29 20:14:51
DeepSeek-V3.2-Exp
华为昇腾
开源
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-V3.2-Exp API价格官宣大幅下调
9月29日,DeepSeek宣布其官方App、网页端及小程序已同步更新至DeepSeek-V3.2-Exp版本。由于新模型服务成本显著降低,官方API价格即刻起大幅下调,开发者调用API的成本将减少50%以上。这一调整为开发者提供了更经济高效的接入方案,进一步推动技术应用的普及与创新。
数据炼金师
09-29 19:17:29
API价格下调
DeepSeek-V3.2-Exp
服务成本降低
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价
9月29日,DeepSeek正式发布实验性模型DeepSeek-V3.2-Exp,并在Huggingface与魔搭平台开源。该版本引入DeepSeek Sparse Attention(DSA)稀疏注意力机制,优化长文本训练和推理效率,同时保持模型输出效果几乎不变。官方将V3.2-Exp与前代V3.1-Terminus的训练设置严格对齐,表现基本持平。本次更新还大幅降低API调用成本,开发者使用费用减少50%以上。目前,官方App、网页端及小程序均已同步更新至新版本。为支持对比测试,V3.1-Terminus的API接口暂时保留。论文及相关资源已公开。
未来编码者
09-29 19:14:08
API降价
DeepSeek-V3.2-Exp
稀疏注意力机制
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-V3.2-Exp发布并开源
9月29日,DeepSeek-V3.2-Exp模型在Hugging Face平台正式发布并开源。该模型采用稀疏Attention架构,显著降低计算资源消耗,同时提升推理效率。目前,华为云已完成对该模型的适配,支持最大160K长序列上下文长度。这一进展为大模型应用提供了更高性能和灵活性。(记者 黄心怡)
智慧棱镜
09-29 18:14:47
DeepSeek-V3.2-Exp
华为云
稀疏 Attention 架构
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序