2025年8月26日,DeepSeek V3.1被曝出严重Bug,模型在代码生成中频繁插入「极/極/extreme」等无关token,例如`time.Second`变成`time.Se极`。问题不仅出现在第三方量化部署,官方全精度版本也复现,影响真实编码流程。此Bug可能源于解码概率分布偏移或分词结果不理想,导致高频token污染输出。类似问题此前在Gemini中也有发生,如陷入「自我否定循环」并输出异常文本。厂商尚未说明原因,但推测与系统提示或后处理规则冲突有关。大模型稳定性问题频发,OpenAI、Gemini等均曾出现相关事故。专家指出,AI工程的稳定性及可控性仍是亟待解决的关键问题。
原文链接
本文链接:https://kx.umi6.com/article/24185.html
转载请注明文章出处
相关推荐
换一换
deepseek关联公司公布大语言模型部署方法专利
2025-08-01 14:04:10
DeepSeek催化下,芯片带领沪指突破3800点
2025-08-22 20:52:41
「DeepSeek们」回答位变广告位
2025-08-05 15:15:26
DeepSeek等开源模型,更“浪费”token吗?
2025-10-11 10:17:13
性能至少翻倍 DeepSeek官宣支持下一代国产AI芯片
2025-08-21 19:40:24
DeepSeek首登《自然》封面:中国大模型创造新历史,做了OpenAI不敢做的事
2025-09-18 16:58:59
Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?
2025-07-17 17:30:33
DeepSeek的一次小更新:暴打OpenAI 追上Gemini
2025-12-03 00:44:54
黄仁勋力赞DeepSeek 对中国创新能力充满信心
2025-07-21 04:12:05
DeepSeek大量招人,该梁文锋上场了
2026-01-16 15:41:13
DeepSeek 出现服务故障:网页 / API 性能异常,已进行修复
2025-11-25 16:59:50
DeepSeek 开年发布新论文:提出全新 mHC 架构,梁文锋现身作者名单
2026-01-01 17:23:53
DeepSeek又更新了,期待梁文锋“炸场”
2025-08-21 09:28:01
676 文章
481570 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18