
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年8月,DeepSeek V3.1模型因输出结果中频繁出现“极”字bug引发热议。该问题最初在火山引擎、chutes等平台被发现,随后波及腾讯CodeBuddy等多个平台,并在国外Reddit上引发讨论。开发者若未察觉此问题可能导致代码编译失败。官方回应称将在最近版本修复。网友分析认为,问题可能源于数据清洗不彻底或模型将“极”字误作终止符学习。目前可通过提示词缓解问题,但彻底解决需等待官方更新。
原文链接
2025年8月,DeepSeek V3.1模型因输出结果中频繁出现‘极’字引发全网热议。该问题最初在火山引擎、chutes等平台被发现,随后波及腾讯CodeBuddy等多个平台,甚至在国外Reddit上也引发讨论。此bug对需要高精度输出的场景造成严重影响,开发者若未察觉可能导致编译失败。官方回应称已联系DeepSeek团队,预计将在新版本修复。网友提出通过提示词缓解问题的方法,但需针对第三方平台使用。知乎网友黄哲威分析,问题或源于数据清洗不彻底,导致模型将‘极’字误用为终止符。具体修复时间待官方更新版本。
原文链接
8月22日,腾讯元宝宣布正式接入DeepSeek V3.1最新版,电脑和网页端现已开放体验。此次更新带来两大核心突破:一是思考效率显著提升,能更快给出答案;二是增强了Agent能力,复杂任务处理更轻松。据深度求索官方介绍,新版本采用混合推理架构,支持思考与非思考模式自由切换,并通过优化大幅提升工具使用和智能体任务表现。目前,用户可通过“深度思考”按钮体验新模式功能。
原文链接
2025年8月21日,DeepSeek官方发布V3.1版本,上下文长度扩展至128k,参数达685B,支持多种精度格式。新版本在编程能力上表现突出,Aider测试中得分71.6%,超越Claude 4 Opus,成本低至1美元。新增原生搜索和特殊Token功能,并优化推理速度和上下文支持。尽管未发布模型卡,V3.1已登上Hugging Face趋势榜第四。实测显示其性能显著提升,但在部分复杂任务上仍有改进空间。网友期待未来R2版本的发布。
原文链接
2025年8月20日,DeepSeek悄然发布V3.1版本模型,未召开发布会却引发技术与投资圈热议。新模型在Aider编程基准测试中以71.6%的得分超越Claude 4 Opus,成本仅1.01美元,为后者1/68。其架构创新(如移除“R1”标识、新增特殊Token)暗示可能采用“混合架构”,对AI产业格局带来深远影响。投资者需关注四大问题:开源与闭源的终局之战是否进入“混合态”;“混合架构”是否成为下一代技术护城河;推理成本骤降如何推动AI应用层爆发;以及性能之外,“企业级就绪度”和垂直领域优化或成决胜关键。此次更新不仅改变竞争格局,还可能重塑整个AI产业链的价值分布。
原文链接
2025年8月20日,DeepSeek V3.1发布,主要更新包括上下文长度拓展至128K和支持多种张量格式。实测显示,V3.1在编程能力、情境写作、数学理解、翻译水平等方面均有显著提升。例如,V3.1在处理GIF压缩任务时提供了更全面的代码说明和优化策略;情境写作中,风格从V3的理性转为更具文艺气息的表达;数学题解答逻辑清晰且正确;翻译表现对长难句的理解更强但偶有小失误。此外,V3.1在冷门知识问答中存在争议性回答。网友测试发现其在非推理模型基准上拿下SOTA成绩,性价比高,但部分线上API仍存在问题。目前,V3.1已可在网页端、APP及小程序使用,Base版本可从抱抱脸下载。
原文链接
2025年7月18日,中国开源模型Kimi K2超越DeepSeek,登上全球开源模型排名第一,并在总榜中位列第五,紧追Grok 4等顶尖闭源模型。Kimi K2在多项能力上表现出色,如连续多轮对话、编程能力和复杂提示词应对均位居前列。其在开源社区反响热烈,GitHub标星达5.6K,Hugging Face下载量近10万。尽管Kimi K2基于DeepSeek V3架构,但通过参数优化实现性能提升,被评价为“精打细算”的改进。随着开源模型崛起,‘开源=性能弱’的刻板印象正被打破,行业专家普遍看好开源未来。值得一提的是,全球总榜TOP 10中唯二开源模型均来自中国。
原文链接
2025年7月,Kimi K2超越DeepSeek成为全球开源模型排名第一,总榜第五,紧追Grok 4等顶尖闭源模型。其在连续对话、编程能力等多项指标上表现优异,甚至与闭源模型抗衡。这是继DeepSeek后,再次由中国团队开发的模型登顶开源榜首。Kimi K2发布一周内,GitHub获5.6K星标,Hugging Face下载量近10万,引发广泛关注。尽管采用DeepSeek V3架构,但通过参数优化实现性能提升,被评价为‘大胆’且高效的选择。行业专家认为,开源模型正迅速崛起,逐渐打破‘开源=性能弱’的刻板印象,未来或将在AI发展中扮演关键角色。
原文链接
2月12日,华为技术有限公司宣布DeepSeek V3/R1 671B旗舰模型(满血版)已全栈优化适配于华为云昇腾云服务,满足商用部署需求。用户可通过华为云ModelArts Studio控制台免费体验该模型,只需登录账号、搜索服务并完成相关授权和实名认证即可。此外,华为云Stack还提供图形化第三方模型部署方案,支持将DeepSeek模型部署到混合云环境中。
原文链接
2月4日,中科曙光国家先进计算产业创新中心宣布,海光信息技术团队完成了DeepSeek V3和R1模型与海光DCU国产化适配,并已正式上线。用户可在“光合开发者社区”的“光源”板块访问和下载这些模型。DeepSeek V3和R1基于Transformer架构,采用MLA和DeepSeek MoE技术,分别优化了内存占用和模型性能。海光DCU是海光信息推出的GPGPU架构AI加速卡,在多个领域实现规模化应用。
原文链接
加载更多

暂无内容