1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
消息称 DeepSeek V3.2、智谱 GLM4.6 等 AI 大模型即将发布
9月29日消息,DeepSeek V3.2和智谱GLM4.6等AI大模型即将发布。据证券时报报道,DeepSeek V3.2基础版本已上传至HuggingFace官方页面,但随后下线;其线上模型上周刚升级至V3.1-Terminus版本。同时,智谱官方在微信群透露,GLM4.6将提供更大的上下文能力。目前,DeepSeek HuggingFace页面已出现V3.2合集,但尚未包含具体模型文件。这些动态表明AI大模型领域仍在快速迭代,引发行业关注。
E-Poet
09-29 18:12:41
AI大模型
DeepSeek V3.2
智谱 GLM4.6
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.2、GLM4.6等大模型即将发布
9月29日,DeepSeek-V3.2和智谱GLM4.6两大模型即将发布。据悉,DeepSeek-V3.2基础版已上传至HuggingFace官方页面,但随后下线,模型文件仍在上传中。智谱官方通过微信群透露,GLM4.6将支持更大的上下文能力,进一步提升性能。这一系列动态表明大模型技术正快速迭代,引发行业广泛关注。(财联社、证券时报)
月光编码师
09-29 17:14:30
DeepSeek V3.2
GLM4.6
大模型
分享至
打开微信扫一扫
内容投诉
生成图片
HLE首次突破60分!Eigen-1基于DeepSeek V3.1领先GPT-5
2025年9月,Eigen-1多智能体系统在HLE Bio/Chem Gold测试集上首次突破60分大关,Pass@1准确率达48.3%,Pass@5达61.74%,超越GPT-5等顶尖模型。该系统基于开源DeepSeek V3.1,通过Monitor-based RAG、HSR和QAIR三大创新机制实现质的飞跃。研究团队来自耶鲁大学、上海交大等机构联合开发,强调隐式知识增强与层级推理优化的重要性。Eigen-1不仅在HLE表现出色,还在SuperGPQA和TRQA等多项任务中取得领先成绩。论文指出,AI科学推理核心挑战在于知识与推理整合,并预示AI辅助科研新范式的到来。项目已开源,未来将拓展至更多领域。
量子黑客
09-29 09:04:51
DeepSeek V3.1
Eigen-1
HLE
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.1更新「最终版」!下一次是V4/R2了???
2025年9月,DeepSeek发布V3.1最终版(Terminus),修复了此前引发热议的“极你太美”随机输出Bug,并优化中英文混杂及异常字符问题。同时,Code Agent与Search Agent能力进一步提升,暗示其AI智能体发展方向。新版本评测显示输出更稳定,但部分场景如Codeforces竞赛表现略有下降,引发网友对安全调整影响性能的讨论。值得注意的是,“Terminus”命名引发猜测,或为V3系列收官之作,未来可能推出全新架构V4或R2版本。此前消息称,DeepSeek预计年底发布新模型,未来3个月或将有更多动态揭晓。模型已上线Hugging Face与ModelScope平台供下载。
智能涌动
09-23 12:13:50
AI Agent
DeepSeek V3.1
Terminus
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.1 输出结果跳出“极”字 bug,官方回应了
2025年8月,DeepSeek V3.1模型因输出结果中频繁出现“极”字bug引发热议。该问题最初在火山引擎、chutes等平台被发现,随后波及腾讯CodeBuddy等多个平台,并在国外Reddit上引发讨论。开发者若未察觉此问题可能导致代码编译失败。官方回应称将在最近版本修复。网友分析认为,问题可能源于数据清洗不彻底或模型将“极”字误作终止符学习。目前可通过提示词缓解问题,但彻底解决需等待官方更新。
月光编码师
08-27 13:01:51
DeepSeek V3.1
数据清洗
极字 bug
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek“极你太美”bug,官方回应了
2025年8月,DeepSeek V3.1模型因输出结果中频繁出现‘极’字引发全网热议。该问题最初在火山引擎、chutes等平台被发现,随后波及腾讯CodeBuddy等多个平台,甚至在国外Reddit上也引发讨论。此bug对需要高精度输出的场景造成严重影响,开发者若未察觉可能导致编译失败。官方回应称已联系DeepSeek团队,预计将在新版本修复。网友提出通过提示词缓解问题的方法,但需针对第三方平台使用。知乎网友黄哲威分析,问题或源于数据清洗不彻底,导致模型将‘极’字误用为终止符。具体修复时间待官方更新版本。
代码编织者Nexus
08-27 12:01:13
DeepSeek V3.1
数据清洗
极字Bug
分享至
打开微信扫一扫
内容投诉
生成图片
腾讯元宝接入 DeepSeek V3.1 最新版,电脑 / 网页版可体验
8月22日,腾讯元宝宣布正式接入DeepSeek V3.1最新版,电脑和网页端现已开放体验。此次更新带来两大核心突破:一是思考效率显著提升,能更快给出答案;二是增强了Agent能力,复杂任务处理更轻松。据深度求索官方介绍,新版本采用混合推理架构,支持思考与非思考模式自由切换,并通过优化大幅提升工具使用和智能体任务表现。目前,用户可通过“深度思考”按钮体验新模式功能。
幻彩逻辑RainbowLogic
08-22 16:51:05
DeepSeek V3.1
模型更新
腾讯元宝
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4
2025年8月21日,DeepSeek官方发布V3.1版本,上下文长度扩展至128k,参数达685B,支持多种精度格式。新版本在编程能力上表现突出,Aider测试中得分71.6%,超越Claude 4 Opus,成本低至1美元。新增原生搜索和特殊Token功能,并优化推理速度和上下文支持。尽管未发布模型卡,V3.1已登上Hugging Face趋势榜第四。实测显示其性能显著提升,但在部分复杂任务上仍有改进空间。网友期待未来R2版本的发布。
AI奇点纪元
08-21 10:27:32
DeepSeek V3.1
上下文长度
编程能力
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.1发布后,投资者该思考这四个问题
2025年8月20日,DeepSeek悄然发布V3.1版本模型,未召开发布会却引发技术与投资圈热议。新模型在Aider编程基准测试中以71.6%的得分超越Claude 4 Opus,成本仅1.01美元,为后者1/68。其架构创新(如移除“R1”标识、新增特殊Token)暗示可能采用“混合架构”,对AI产业格局带来深远影响。投资者需关注四大问题:开源与闭源的终局之战是否进入“混合态”;“混合架构”是否成为下一代技术护城河;推理成本骤降如何推动AI应用层爆发;以及性能之外,“企业级就绪度”和垂直领域优化或成决胜关键。此次更新不仅改变竞争格局,还可能重塑整个AI产业链的价值分布。
智能涌动
08-21 09:26:48
DeepSeek V3.1
开源 vs 闭源
混合架构
分享至
打开微信扫一扫
内容投诉
生成图片
实测DeepSeek V3.1,不止拓展上下文长度
2025年8月20日,DeepSeek V3.1发布,主要更新包括上下文长度拓展至128K和支持多种张量格式。实测显示,V3.1在编程能力、情境写作、数学理解、翻译水平等方面均有显著提升。例如,V3.1在处理GIF压缩任务时提供了更全面的代码说明和优化策略;情境写作中,风格从V3的理性转为更具文艺气息的表达;数学题解答逻辑清晰且正确;翻译表现对长难句的理解更强但偶有小失误。此外,V3.1在冷门知识问答中存在争议性回答。网友测试发现其在非推理模型基准上拿下SOTA成绩,性价比高,但部分线上API仍存在问题。目前,V3.1已可在网页端、APP及小程序使用,Base版本可从抱抱脸下载。
虚拟微光
08-20 17:21:15
DeepSeek V3.1
上下文长度
编程能力
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序