V3.1 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

华为计算：KunLun AI Space 基于昇腾实现 DeepSeek V3.1 FP8 推理，成本减半

10月28日，华为计算宣布河南昆仑技术有限公司基于昇腾AI研发出软FP8解决方案，用于DeepSeek V3.1大模型推理。该方案采用FP8精度格式，显存需求减半，硬件压力降低，同时相比INT8量化精度更高、数据范围更广，实现“精度无损、成本减半”。通过反量化算子将FP8权重转化为BF16格式计算，保障准确性并提升适配灵活性。单台KunLun G8600可流畅运行满血版DeepSeek V3.1，其他机型也能实现参数规模翻倍和并发能力提升。方案具备三大核心技术：自研反量化算子、推理效率提升32%、主流模型无缝兼容，并全面支持DeepSeek V3.1等FP8量化模型，扩展性强，可快速适配新模型。

原文链接

AI思维矩阵

10-28 21:06:36

DeepSeek V3.1

FP8

昇腾AI

分享至

打开微信扫一扫

内容投诉

生成图片

HLE首次突破60分！Eigen-1基于DeepSeek V3.1领先GPT-5

2025年9月，Eigen-1多智能体系统在HLE Bio/Chem Gold测试集上首次突破60分大关，Pass@1准确率达48.3%，Pass@5达61.74%，超越GPT-5等顶尖模型。该系统基于开源DeepSeek V3.1，通过Monitor-based RAG、HSR和QAIR三大创新机制实现质的飞跃。研究团队来自耶鲁大学、上海交大等机构联合开发，强调隐式知识增强与层级推理优化的重要性。Eigen-1不仅在HLE表现出色，还在SuperGPQA和TRQA等多项任务中取得领先成绩。论文指出，AI科学推理核心挑战在于知识与推理整合，并预示AI辅助科研新范式的到来。项目已开源，未来将拓展至更多领域。

原文链接

量子黑客

09-29 09:04:51

DeepSeek V3.1

Eigen-1

HLE

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V3.1更新「最终版」！下一次是V4/R2了？？？

2025年9月，DeepSeek发布V3.1最终版（Terminus），修复了此前引发热议的“极你太美”随机输出Bug，并优化中英文混杂及异常字符问题。同时，Code Agent与Search Agent能力进一步提升，暗示其AI智能体发展方向。新版本评测显示输出更稳定，但部分场景如Codeforces竞赛表现略有下降，引发网友对安全调整影响性能的讨论。值得注意的是，“Terminus”命名引发猜测，或为V3系列收官之作，未来可能推出全新架构V4或R2版本。此前消息称，DeepSeek预计年底发布新模型，未来3个月或将有更多动态揭晓。模型已上线Hugging Face与ModelScope平台供下载。

原文链接

智能涌动

09-23 12:13:50

AI Agent

DeepSeek V3.1

Terminus

分享至

打开微信扫一扫

内容投诉

生成图片

实测美团 LongCat：快到极致，但是别说追平 DeepSeek

2025年9月5日，美团推出的开源大模型LongCat-Flash-Chat因“快如闪电”的响应速度引发关注，尤其在轻量问答场景中表现惊艳。然而，实测显示其推理能力存在明显短板，复杂问题回答时逻辑混乱、重点模糊，与DeepSeek-V3.1相比差距显著。DeepSeek在逻辑拆解和因果推理上表现更稳健，答案条理清晰且可信赖。实测表明，LongCat在速度上领先，单用户生成速度超100 tokens/秒，但推理场景下短板暴露无遗。行业观点认为，速度虽能带来短期惊艳，但逻辑才是模型赢得用户信任的关键。作为美团首款开源模型，LongCat在交互体验上有突破，但在高价值场景中仍有提升空间。

原文链接

跨界思维

09-05 15:22:48

DeepSeek-V3.1

LongCat-Flash-Chat

速度与逻辑

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V3.1 输出结果跳出“极”字 bug，官方回应了

2025年8月，DeepSeek V3.1模型因输出结果中频繁出现“极”字bug引发热议。该问题最初在火山引擎、chutes等平台被发现，随后波及腾讯CodeBuddy等多个平台，并在国外Reddit上引发讨论。开发者若未察觉此问题可能导致代码编译失败。官方回应称将在最近版本修复。网友分析认为，问题可能源于数据清洗不彻底或模型将“极”字误作终止符学习。目前可通过提示词缓解问题，但彻底解决需等待官方更新。

原文链接

月光编码师

08-27 13:01:51

DeepSeek V3.1

数据清洗

极字 bug

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek“极你太美”bug，官方回应了

2025年8月，DeepSeek V3.1模型因输出结果中频繁出现‘极’字引发全网热议。该问题最初在火山引擎、chutes等平台被发现，随后波及腾讯CodeBuddy等多个平台，甚至在国外Reddit上也引发讨论。此bug对需要高精度输出的场景造成严重影响，开发者若未察觉可能导致编译失败。官方回应称已联系DeepSeek团队，预计将在新版本修复。网友提出通过提示词缓解问题的方法，但需针对第三方平台使用。知乎网友黄哲威分析，问题或源于数据清洗不彻底，导致模型将‘极’字误用为终止符。具体修复时间待官方更新版本。

原文链接

代码编织者Nexus

08-27 12:01:13

DeepSeek V3.1

数据清洗

极字Bug

分享至

打开微信扫一扫

内容投诉

生成图片

华泰证券：DeepSeek-V3.1发布国产算力链迎来高景气

8月26日，华泰证券发布研报称，DeepSeek-V3.1版本正式推出，采用UE8M0 FP8精度参数，具备高效能和大动态范围特点，并可避免信息损失。该版本专为下一代国产芯片设计，标志着国产软硬件协同取得显著成果。在海外GPU供应受限及国内互联网厂商资本开支增长的背景下，国产算力基础设施需求有望持续高景气。研报建议关注国产算力及其配套产业链，包括光模块、AIDC、交换机和铜连接等领域。

原文链接

智能视野

08-26 08:41:47

DeepSeek-V3.1

华泰证券

国产算力

分享至

打开微信扫一扫

内容投诉

生成图片

硅基流动上线 DeepSeek-V3.1，上下文升至 160K

8月25日，硅基流动宣布上线深度求索团队开源的DeepSeek-V3.1模型。该模型总参数达671B，激活参数37B，采用混合推理架构，思考效率更高，工具使用与智能体任务表现显著提升，性能在多项测试中比肩Claude 4 Sonnet等主流模型。新版本支持160K超长上下文，适用于长文档解析、多轮对话、复杂任务处理等场景，且成本仅为Claude 4 Sonnet输入的1/5、输出的1/9。此外，其最大支持500万TPM，可无损解析法律合同、学术文献等，并实现高精度RAG增强检索，大幅降低错误率。

原文链接

梦境编程师

08-25 21:34:29

DeepSeek-V3.1

硅基流动

超长上下文

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek-V3.1 上线火山方舟：无需注册登录即可免费体验

8月23日，火山引擎宣布DeepSeek-V3.1模型正式上线火山方舟平台，用户无需注册登录即可免费体验。该模型提供20-40ms超低延迟和500万初始并发TPM，性能与DeepSeek官方API高度一致。通过火山方舟体验中心的Canvas功能，用户可便捷测试网页编程能力，并支持一键跳转控制台完成模型调用配置，全程可视化操作大幅缩短开发链路。此外，火山引擎大模型应用实验室还推出了DeepSeek-V3.1的联网增强版本，进一步拓展应用场景。

原文链接

数据炼金师

08-23 13:00:04

DeepSeek-V3.1

免费体验

火山方舟

分享至

打开微信扫一扫

内容投诉

生成图片

腾讯元宝接入 DeepSeek V3.1 最新版，电脑 / 网页版可体验

8月22日，腾讯元宝宣布正式接入DeepSeek V3.1最新版，电脑和网页端现已开放体验。此次更新带来两大核心突破：一是思考效率显著提升，能更快给出答案；二是增强了Agent能力，复杂任务处理更轻松。据深度求索官方介绍，新版本采用混合推理架构，支持思考与非思考模式自由切换，并通过优化大幅提升工具使用和智能体任务表现。目前，用户可通过“深度思考”按钮体验新模式功能。

原文链接