2025年9月29日,DeepSeek正式发布实验性版本V3.2-Exp,并开源。该版本引入稀疏注意力机制,优化长文本训练与推理效率,同时支持TileLang和CUDA两种GPU算子版本。API价格大幅下调,输入和输出成本降低超50%。中信建投分析师评价其易用性显著提升。官方表示,新模型在基准测试中表现与前代相当。此外,TileLang编程语言由北大团队开发,可大幅提升开发效率。同日,阿里云发布Qwen3-Max等七款大模型产品,智谱GLM-4.6即将上线,月之暗面Kimi推出Agent模式“OK Computer”灰度测试。
原文链接
本文链接:https://kx.umi6.com/article/26087.html
转载请注明文章出处
相关推荐
换一换
DeepSeek-V3.2-Exp发布并开源
2025-09-29 18:14:47
DeepSeek-V3.2-Exp官宣发布,API价格下调超50%
2025-09-29 20:15:06
DeepSeek 再放降本大招:NSA 官宣发布,加速推理降低成本,并且不牺牲性能
2025-02-18 17:24:09
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
2025-09-29 20:14:51
DeepSeek新模型上线
2025-09-30 11:25:43
DeepSeek新发布
2025-09-29 22:15:21
华为昇腾、寒武纪、海光信息适配DeepSeek最新模型
2025-09-30 09:26:21
DeepSeek新论文再次引发热议,它说了什么?
2025-02-19 16:53:40
Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini
2025-01-27 14:30:40
月之暗面 MoBA 核心作者自述:一个 “新晋大模型训练师” 的三入思过崖
2025-02-21 14:53:27
DeepSeek-V3.2-Exp第一时间上线华为云
2025-09-30 00:16:10
DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价
2025-09-29 19:14:08
DeepSeek-V3.2-Exp API价格官宣大幅下调
2025-09-29 19:17:29
644 文章
355927 浏览
24小时热文
更多
-
2025-12-07 22:52:28 -
2025-12-07 22:51:22 -
2025-12-07 21:52:07