1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

DeepSeek不惜代价保住它!V4关键特性被挖出来了

DeepSeek V4技术报告持续引发关注,一个新发现是,V4为了保留核心设计“batch invariance”(批次不变性),甚至不惜牺牲性能。Batch invariance确保同一token在不同批次组织下输出完全一致,但其实现成本高昂:GPU利用率下降、推理速度变慢、工程复杂度飙升。

为什么DeepSeek如此执着于batch invariance?首先,它保证线上推理结果稳定。动态batching可能导致相同输入因批次组合或计算路径不同而产生差异,而batch invariance避免了这一问题。其次,它确保预训练、后训练和推理之间的对齐,减少数值不确定性来源,提升可复现性和调试效率。此外,batch invariance为长上下文系统提供底层支持,使复杂组件如稀疏注意力、MoE等协同工作时保持一致性。最后,它让后训练更稳定,减少细微数值扰动对RL、蒸馏等敏感任务的影响。

然而,这些优势也伴随着牺牲。V4无法使用split-KV、split-K等常见优化方法,因为它们会破坏逐比特一致性。为此,DeepSeek开发了dual-kernel和自研DeepGEMM,分别处理注意力和矩阵乘法的计算需求。这导致GPU利用率降低、小批量任务速度减慢以及部分稀疏加速受限。

尽管如此,V4换来了训练、推理和RL阶段的逐比特可复现性,以及长上下文和多机多卡任务的高度对齐。正如Hugging Face的Arthur Zucker所言,DeepSeek将多年努力免费公开,堪称伟大。

参考链接:
[1] https://x.com/teortaxesTex/status/2048707398886404524?s=20
[2] https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

原文链接
本文链接:https://kx.umi6.com/article/35299.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Cursor 9秒删库搞崩公司,然后…写了份检讨
2026-04-28 17:27:55
OpenAI,危机四伏
2026-04-27 10:03:03
DeepSeek注册资本提高50%
2026-04-28 09:06:54
AI硬件引领科技行情 基金经理高位选股趋理性
2026-04-27 08:01:31
Token驱动未来,城市如何抢占算力新赛道?
2026-04-27 15:18:53
两部门:选择人工智能产业基础较好、数据资源丰富的城市(含直辖市下属区县)作为“模数共振”行动实施的重点城市
2026-04-28 15:28:52
科思科技推出基于昇腾910B芯片的全国产全加固智能计算模组
2026-04-28 12:13:46
摩尔线程新设科技公司 含集成电路芯片设计业务
2026-04-27 15:24:45
国家电网:要加快实现自主可控 大力发展人工智能
2026-04-27 21:38:43
广东“十五五”规划纲要:加快布局光芯片等领域 大力发展核心设备及零部件、关键材料
2026-04-28 11:12:08
高德专车引入“AI专车管家”:嵌入接驾、行程与服务全流程
2026-04-27 18:29:09
芒果传媒与爱诗科技达成战略合作,全栈AI视频能力接入芒果内容生态
2026-04-27 18:25:41
中信建投:看好AI应用落地与AI算力需求增长
2026-04-28 08:02:34
24小时热文
更多
扫一扫体验小程序