DeepSeek V3 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

DeepSeek V3.2爆火，Agentic性能暴涨40%解密

2025年12月5日，DeepSeek V3.2发布，其Agentic性能提升40%，关键在于引入‘交错思维链’（Interleaved Thinking）机制。该技术通过在推理与工具调用间交替记录思考状态，显著增强了模型的长程规划能力，解决了AI‘健忘症’问题。类似的技术已在MiniMax M2、Kimi K2 Thinking等模型中应用，并取得显著效果，尤其在高扰动环境下的任务表现提升明显。这一机制不仅优化了复杂场景中的稳定性，还推动了行业基础设施升级。目前，交错思维链已成为智能体进化的核心路径，多家公司正合力推动其标准化。AWS re:Invent 2025大会上，亚马逊宣布将MiniMax M2纳入Amazon Bedrock模型库，彰显行业共识。

原文链接

电子诗篇

12-05 17:41:21

Agent能力

DeepSeek V3.2

交错思维链

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V3.2与国外顶级AI有差距：算力受限未来会解决

12月2日，DeepSeek低调发布DeepSeek V3.2正式版及长思考加强版。官方称其在推理类Benchmark测试中达到GPT-5水平，略低于Gemini-3.0-Pro，并取得IMO国际数学奥赛等金牌水平。然而，编程领域表现不及Claude、Gemini-3.0-Pro等顶级AI。DeepSeek承认，模型因总训练FLOPS较少、标记效率低等问题存在局限性，未来将通过扩展算力和数据资源解决。V4或R2版本预计春节前后发布，有望实现更强大性能。

原文链接

蝶舞CyberSwirl

12-02 21:35:41

DeepSeek V3.2

算力受限

顶级AI

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V3.2 正式版发布：推理比肩 GPT-5，首推 Speciale 版本拿下奥数金牌

2025年12月1日，DeepSeek V3.2 正式版发布，包含 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 两个版本。V3.2 推理能力比肩 GPT-5，适合日常问答和通用任务；Speciale 版本则专攻复杂推理，斩获 IMO、CMO、ICPC、IOI 金牌，表现媲美人类顶尖选手。Speciale 还结合了数学证明与逻辑验证能力，但成本较高，仅限研究使用。新模型支持思考模式与工具调用，强化 Agent 能力，并通过大规模合成数据提升泛化性能。DeepSeek-V3.2 在智能体评测中达到开源模型最高水平，缩小与闭源模型差距。开源地址已公布，供社区评测与研究。

原文链接

神经网络领航员

12-01 19:27:59

DeepSeek V3.2

Speciale

推理能力

分享至

打开微信扫一扫

内容投诉

生成图片

华为计算：KunLun AI Space 基于昇腾实现 DeepSeek V3.1 FP8 推理，成本减半

10月28日，华为计算宣布河南昆仑技术有限公司基于昇腾AI研发出软FP8解决方案，用于DeepSeek V3.1大模型推理。该方案采用FP8精度格式，显存需求减半，硬件压力降低，同时相比INT8量化精度更高、数据范围更广，实现“精度无损、成本减半”。通过反量化算子将FP8权重转化为BF16格式计算，保障准确性并提升适配灵活性。单台KunLun G8600可流畅运行满血版DeepSeek V3.1，其他机型也能实现参数规模翻倍和并发能力提升。方案具备三大核心技术：自研反量化算子、推理效率提升32%、主流模型无缝兼容，并全面支持DeepSeek V3.1等FP8量化模型，扩展性强，可快速适配新模型。

原文链接

AI思维矩阵

10-28 21:06:36

DeepSeek V3.1

FP8

昇腾AI

分享至

打开微信扫一扫

内容投诉

生成图片

消息称 DeepSeek V3.2、智谱 GLM4.6 等 AI 大模型即将发布

9月29日消息，DeepSeek V3.2和智谱GLM4.6等AI大模型即将发布。据证券时报报道，DeepSeek V3.2基础版本已上传至HuggingFace官方页面，但随后下线；其线上模型上周刚升级至V3.1-Terminus版本。同时，智谱官方在微信群透露，GLM4.6将提供更大的上下文能力。目前，DeepSeek HuggingFace页面已出现V3.2合集，但尚未包含具体模型文件。这些动态表明AI大模型领域仍在快速迭代，引发行业关注。

原文链接

E-Poet

09-29 18:12:41

AI大模型

DeepSeek V3.2

智谱 GLM4.6

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V3.2、GLM4.6等大模型即将发布

9月29日，DeepSeek-V3.2和智谱GLM4.6两大模型即将发布。据悉，DeepSeek-V3.2基础版已上传至HuggingFace官方页面，但随后下线，模型文件仍在上传中。智谱官方通过微信群透露，GLM4.6将支持更大的上下文能力，进一步提升性能。这一系列动态表明大模型技术正快速迭代，引发行业广泛关注。（财联社、证券时报）

原文链接

月光编码师

09-29 17:14:30

DeepSeek V3.2

GLM4.6

大模型

分享至

打开微信扫一扫

内容投诉

生成图片

HLE首次突破60分！Eigen-1基于DeepSeek V3.1领先GPT-5

2025年9月，Eigen-1多智能体系统在HLE Bio/Chem Gold测试集上首次突破60分大关，Pass@1准确率达48.3%，Pass@5达61.74%，超越GPT-5等顶尖模型。该系统基于开源DeepSeek V3.1，通过Monitor-based RAG、HSR和QAIR三大创新机制实现质的飞跃。研究团队来自耶鲁大学、上海交大等机构联合开发，强调隐式知识增强与层级推理优化的重要性。Eigen-1不仅在HLE表现出色，还在SuperGPQA和TRQA等多项任务中取得领先成绩。论文指出，AI科学推理核心挑战在于知识与推理整合，并预示AI辅助科研新范式的到来。项目已开源，未来将拓展至更多领域。

原文链接

量子黑客

09-29 09:04:51

DeepSeek V3.1

Eigen-1

HLE

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V3.1更新「最终版」！下一次是V4/R2了？？？

2025年9月，DeepSeek发布V3.1最终版（Terminus），修复了此前引发热议的“极你太美”随机输出Bug，并优化中英文混杂及异常字符问题。同时，Code Agent与Search Agent能力进一步提升，暗示其AI智能体发展方向。新版本评测显示输出更稳定，但部分场景如Codeforces竞赛表现略有下降，引发网友对安全调整影响性能的讨论。值得注意的是，“Terminus”命名引发猜测，或为V3系列收官之作，未来可能推出全新架构V4或R2版本。此前消息称，DeepSeek预计年底发布新模型，未来3个月或将有更多动态揭晓。模型已上线Hugging Face与ModelScope平台供下载。

原文链接

智能涌动

09-23 12:13:50

AI Agent

DeepSeek V3.1

Terminus

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V3.1 输出结果跳出“极”字 bug，官方回应了

2025年8月，DeepSeek V3.1模型因输出结果中频繁出现“极”字bug引发热议。该问题最初在火山引擎、chutes等平台被发现，随后波及腾讯CodeBuddy等多个平台，并在国外Reddit上引发讨论。开发者若未察觉此问题可能导致代码编译失败。官方回应称将在最近版本修复。网友分析认为，问题可能源于数据清洗不彻底或模型将“极”字误作终止符学习。目前可通过提示词缓解问题，但彻底解决需等待官方更新。

原文链接

月光编码师

08-27 13:01:51

DeepSeek V3.1

数据清洗

极字 bug

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek“极你太美”bug，官方回应了

2025年8月，DeepSeek V3.1模型因输出结果中频繁出现‘极’字引发全网热议。该问题最初在火山引擎、chutes等平台被发现，随后波及腾讯CodeBuddy等多个平台，甚至在国外Reddit上也引发讨论。此bug对需要高精度输出的场景造成严重影响，开发者若未察觉可能导致编译失败。官方回应称已联系DeepSeek团队，预计将在新版本修复。网友提出通过提示词缓解问题的方法，但需针对第三方平台使用。知乎网友黄哲威分析，问题或源于数据清洗不彻底，导致模型将‘极’字误用为终止符。具体修复时间待官方更新版本。

原文链接