2025年8月26日,DeepSeek V3.1被曝出严重Bug,模型在代码生成中频繁插入「极/極/extreme」等无关token,例如`time.Second`变成`time.Se极`。问题不仅出现在第三方量化部署,官方全精度版本也复现,影响真实编码流程。此Bug可能源于解码概率分布偏移或分词结果不理想,导致高频token污染输出。类似问题此前在Gemini中也有发生,如陷入「自我否定循环」并输出异常文本。厂商尚未说明原因,但推测与系统提示或后处理规则冲突有关。大模型稳定性问题频发,OpenAI、Gemini等均曾出现相关事故。专家指出,AI工程的稳定性及可控性仍是亟待解决的关键问题。
原文链接
本文链接:https://kx.umi6.com/article/24185.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek们越来越聪明,却也越来越不听话了
2025-05-20 22:46:53
DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖
2025-08-01 17:03:23
DeepSeek昨天悄悄扔的炸弹,今天爆了
2025-08-22 17:51:00
英伟达 CEO 黄仁勋:中国的 Deepseek 和阿里通义千问是当前最佳开源模型
2025-05-30 21:55:28
玩完 DeepSeek R1 新版,外国网友又「蚌埠住了」?
2025-06-03 10:50:11
周鸿祎解读DeepSeek更新:中美AI实力已平起平坐
2025-06-09 17:33:29
微软纳德拉应对 AI 新挑战,DeepSeek 崛起引发战略调整
2025-05-16 14:27:57
德国要求苹果与谷歌下架DeepSeek应用 中方已多次明确表态
2025-06-28 12:19:15
为什么日本出不来DeepSeek?
2025-04-24 11:32:28
调查 | 爆火仅半年,DeepSeek在银行业已“泯然众模型”?三大障碍成为拦路虎
2025-08-04 11:56:14
3万字读懂:一季度全球AI应用,谁暴涨?谁掉队?
2025-05-09 14:55:56
百度借力DeepSeek,但AI搜索要如何变现?
2025-05-25 22:26:30
DeepSeek带飞寒武纪
2025-04-23 12:55:50
484 文章
123176 浏览
24小时热文
更多

-
2025-08-27 00:55:21
-
2025-08-26 22:55:59
-
2025-08-26 22:54:53