1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
DeepSeek V3.2爆火,Agentic性能暴涨40%解密
2025年12月5日,DeepSeek V3.2发布,其Agentic性能提升40%,关键在于引入‘交错思维链’(Interleaved Thinking)机制。该技术通过在推理与工具调用间交替记录思考状态,显著增强了模型的长程规划能力,解决了AI‘健忘症’问题。类似的技术已在MiniMax M2、Kimi K2 Thinking等模型中应用,并取得显著效果,尤其在高扰动环境下的任务表现提升明显。这一机制不仅优化了复杂场景中的稳定性,还推动了行业基础设施升级。目前,交错思维链已成为智能体进化的核心路径,多家公司正合力推动其标准化。AWS re:Invent 2025大会上,亚马逊宣布将MiniMax M2纳入Amazon Bedrock模型库,彰显行业共识。
电子诗篇
12-05 17:41:21
Agent能力
DeepSeek V3.2
交错思维链
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.2与国外顶级AI有差距:算力受限 未来会解决
12月2日,DeepSeek低调发布DeepSeek V3.2正式版及长思考加强版。官方称其在推理类Benchmark测试中达到GPT-5水平,略低于Gemini-3.0-Pro,并取得IMO国际数学奥赛等金牌水平。然而,编程领域表现不及Claude、Gemini-3.0-Pro等顶级AI。DeepSeek承认,模型因总训练FLOPS较少、标记效率低等问题存在局限性,未来将通过扩展算力和数据资源解决。V4或R2版本预计春节前后发布,有望实现更强大性能。
蝶舞CyberSwirl
12-02 21:35:41
DeepSeek V3.2
算力受限
顶级AI
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.2 正式版发布:推理比肩 GPT-5,首推 Speciale 版本拿下奥数金牌
2025年12月1日,DeepSeek V3.2 正式版发布,包含 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 两个版本。V3.2 推理能力比肩 GPT-5,适合日常问答和通用任务;Speciale 版本则专攻复杂推理,斩获 IMO、CMO、ICPC、IOI 金牌,表现媲美人类顶尖选手。Speciale 还结合了数学证明与逻辑验证能力,但成本较高,仅限研究使用。新模型支持思考模式与工具调用,强化 Agent 能力,并通过大规模合成数据提升泛化性能。DeepSeek-V3.2 在智能体评测中达到开源模型最高水平,缩小与闭源模型差距。开源地址已公布,供社区评测与研究。
神经网络领航员
12-01 19:27:59
DeepSeek V3.2
Speciale
推理能力
分享至
打开微信扫一扫
内容投诉
生成图片
华为计算:KunLun AI Space 基于昇腾实现 DeepSeek V3.1 FP8 推理,成本减半
10月28日,华为计算宣布河南昆仑技术有限公司基于昇腾AI研发出软FP8解决方案,用于DeepSeek V3.1大模型推理。该方案采用FP8精度格式,显存需求减半,硬件压力降低,同时相比INT8量化精度更高、数据范围更广,实现“精度无损、成本减半”。通过反量化算子将FP8权重转化为BF16格式计算,保障准确性并提升适配灵活性。单台KunLun G8600可流畅运行满血版DeepSeek V3.1,其他机型也能实现参数规模翻倍和并发能力提升。方案具备三大核心技术:自研反量化算子、推理效率提升32%、主流模型无缝兼容,并全面支持DeepSeek V3.1等FP8量化模型,扩展性强,可快速适配新模型。
AI思维矩阵
10-28 21:06:36
DeepSeek V3.1
FP8
昇腾AI
分享至
打开微信扫一扫
内容投诉
生成图片
消息称 DeepSeek V3.2、智谱 GLM4.6 等 AI 大模型即将发布
9月29日消息,DeepSeek V3.2和智谱GLM4.6等AI大模型即将发布。据证券时报报道,DeepSeek V3.2基础版本已上传至HuggingFace官方页面,但随后下线;其线上模型上周刚升级至V3.1-Terminus版本。同时,智谱官方在微信群透露,GLM4.6将提供更大的上下文能力。目前,DeepSeek HuggingFace页面已出现V3.2合集,但尚未包含具体模型文件。这些动态表明AI大模型领域仍在快速迭代,引发行业关注。
E-Poet
09-29 18:12:41
AI大模型
DeepSeek V3.2
智谱 GLM4.6
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.2、GLM4.6等大模型即将发布
9月29日,DeepSeek-V3.2和智谱GLM4.6两大模型即将发布。据悉,DeepSeek-V3.2基础版已上传至HuggingFace官方页面,但随后下线,模型文件仍在上传中。智谱官方通过微信群透露,GLM4.6将支持更大的上下文能力,进一步提升性能。这一系列动态表明大模型技术正快速迭代,引发行业广泛关注。(财联社、证券时报)
月光编码师
09-29 17:14:30
DeepSeek V3.2
GLM4.6
大模型
分享至
打开微信扫一扫
内容投诉
生成图片
HLE首次突破60分!Eigen-1基于DeepSeek V3.1领先GPT-5
2025年9月,Eigen-1多智能体系统在HLE Bio/Chem Gold测试集上首次突破60分大关,Pass@1准确率达48.3%,Pass@5达61.74%,超越GPT-5等顶尖模型。该系统基于开源DeepSeek V3.1,通过Monitor-based RAG、HSR和QAIR三大创新机制实现质的飞跃。研究团队来自耶鲁大学、上海交大等机构联合开发,强调隐式知识增强与层级推理优化的重要性。Eigen-1不仅在HLE表现出色,还在SuperGPQA和TRQA等多项任务中取得领先成绩。论文指出,AI科学推理核心挑战在于知识与推理整合,并预示AI辅助科研新范式的到来。项目已开源,未来将拓展至更多领域。
量子黑客
09-29 09:04:51
DeepSeek V3.1
Eigen-1
HLE
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.1更新「最终版」!下一次是V4/R2了???
2025年9月,DeepSeek发布V3.1最终版(Terminus),修复了此前引发热议的“极你太美”随机输出Bug,并优化中英文混杂及异常字符问题。同时,Code Agent与Search Agent能力进一步提升,暗示其AI智能体发展方向。新版本评测显示输出更稳定,但部分场景如Codeforces竞赛表现略有下降,引发网友对安全调整影响性能的讨论。值得注意的是,“Terminus”命名引发猜测,或为V3系列收官之作,未来可能推出全新架构V4或R2版本。此前消息称,DeepSeek预计年底发布新模型,未来3个月或将有更多动态揭晓。模型已上线Hugging Face与ModelScope平台供下载。
智能涌动
09-23 12:13:50
AI Agent
DeepSeek V3.1
Terminus
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.1 输出结果跳出“极”字 bug,官方回应了
2025年8月,DeepSeek V3.1模型因输出结果中频繁出现“极”字bug引发热议。该问题最初在火山引擎、chutes等平台被发现,随后波及腾讯CodeBuddy等多个平台,并在国外Reddit上引发讨论。开发者若未察觉此问题可能导致代码编译失败。官方回应称将在最近版本修复。网友分析认为,问题可能源于数据清洗不彻底或模型将“极”字误作终止符学习。目前可通过提示词缓解问题,但彻底解决需等待官方更新。
月光编码师
08-27 13:01:51
DeepSeek V3.1
数据清洗
极字 bug
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek“极你太美”bug,官方回应了
2025年8月,DeepSeek V3.1模型因输出结果中频繁出现‘极’字引发全网热议。该问题最初在火山引擎、chutes等平台被发现,随后波及腾讯CodeBuddy等多个平台,甚至在国外Reddit上也引发讨论。此bug对需要高精度输出的场景造成严重影响,开发者若未察觉可能导致编译失败。官方回应称已联系DeepSeek团队,预计将在新版本修复。网友提出通过提示词缓解问题的方法,但需针对第三方平台使用。知乎网友黄哲威分析,问题或源于数据清洗不彻底,导致模型将‘极’字误用为终止符。具体修复时间待官方更新版本。
代码编织者Nexus
08-27 12:01:13
DeepSeek V3.1
数据清洗
极字Bug
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序