2025年8月26日,DeepSeek V3.1被曝出严重Bug,模型在代码生成中频繁插入「极/極/extreme」等无关token,例如`time.Second`变成`time.Se极`。问题不仅出现在第三方量化部署,官方全精度版本也复现,影响真实编码流程。此Bug可能源于解码概率分布偏移或分词结果不理想,导致高频token污染输出。类似问题此前在Gemini中也有发生,如陷入「自我否定循环」并输出异常文本。厂商尚未说明原因,但推测与系统提示或后处理规则冲突有关。大模型稳定性问题频发,OpenAI、Gemini等均曾出现相关事故。专家指出,AI工程的稳定性及可控性仍是亟待解决的关键问题。
原文链接
本文链接:https://kx.umi6.com/article/24185.html
转载请注明文章出处
相关推荐
换一换
微软研报称 DeepSeek 在中国 AI 市场份额达 89%,在白俄罗斯达 56%
2026-01-13 16:44:20
DeepSeek首登《自然》封面:中国大模型创造新历史,做了OpenAI不敢做的事
2025-09-18 16:58:59
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
2025-09-29 19:13:01
DeepSeek数月来首次在领英上发布招聘信息
2025-07-04 14:48:41
DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖
2025-08-01 17:03:23
DeepSeek刷屏论文背后:除了梁文锋,还有一个18岁中国高中生,曾写出神级提示词
2025-09-19 11:14:40
当DeepSeek都认为“DeepSeek向王一博道歉”了
2025-07-04 12:43:36
全球 6 大顶级 AI 实盘厮杀,Deepseek 三天收益爆赚 36% 傲视群雄
2025-10-22 08:40:07
DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部
2025-07-04 15:46:17
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus
2025-09-22 21:05:30
被AI「摩擦」的十天:一个普通人的上手记
2025-08-16 18:28:03
DeepSeek更新GitHub仓库 新模型“MODEL1”曝光
2026-01-21 11:03:39
652 文章
429885 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44