2025年9月29日,DeepSeek正式发布并开源实验性版本V3.2-Exp,引入稀疏注意力机制优化长文本处理效率。中信建投分析师评价其易用性大幅提升。此次更新同步上线官方App、网页端和小程序,API价格大幅降低,开发者调用成本减少超50%。同时,DeepSeek开源TileLang与CUDA双版本GPU算子,建议社区使用TileLang版本以加速研究迭代。TileLang由北大团队开发,显著减少代码量且性能持平。此外,阿里云发布七款大模型产品,包括Qwen3-Max;智谱GLM-4.6即将发布;月之暗面Kimi推出Agent模式“OK Computer”灰度测试,强化智能体能力。
原文链接
本文链接:https://kx.umi6.com/article/26092.html
转载请注明文章出处
相关推荐
换一换
Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini
2025-01-27 14:30:40
DeepSeek 再放降本大招:NSA 官宣发布,加速推理降低成本,并且不牺牲性能
2025-02-18 17:24:09
华为昇腾、寒武纪、海光信息适配DeepSeek最新模型
2025-09-30 09:26:21
寒武纪Day 0适配DeepSeek-V3.2-Exp 同步开源推理引擎vLLM-MLU
2025-09-29 21:16:07
DeepSeek-V3.2-Exp发布并开源
2025-09-29 18:14:47
智谱GLM-5技术全公开!完全适配华为等国产芯片,美国网友酸了
2026-02-23 15:59:51
DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价
2025-09-29 19:14:08
DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价
2025-09-29 19:14:08
月之暗面 MoBA 核心作者自述:一个 “新晋大模型训练师” 的三入思过崖
2025-02-21 14:53:27
DeepSeek新模型上线
2025-09-30 11:25:43
DeepSeek-V4-Pro API永久降价 调整为原定价的1/4
2026-05-23 15:46:56
九章云极率先完成DeepSeek-V3.2-Exp适配,提供安全高效部署方案
2025-09-30 16:29:13
DeepSeek-V3.2-Exp官宣发布,API价格下调超50%
2025-09-29 20:15:06
754 文章
651195 浏览
24小时热文
更多
-
2026-06-09 00:53:08 -
2026-06-08 23:49:41 -
2026-06-08 21:46:02