
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年9月,Eigen-1多智能体系统在HLE Bio/Chem Gold测试集上首次突破60分大关,Pass@1准确率达48.3%,Pass@5达61.74%,超越GPT-5等顶尖模型。该系统基于开源DeepSeek V3.1,通过Monitor-based RAG、HSR和QAIR三大创新机制实现质的飞跃。研究团队来自耶鲁大学、上海交大等机构联合开发,强调隐式知识增强与层级推理优化的重要性。Eigen-1不仅在HLE表现出色,还在SuperGPQA和TRQA等多项任务中取得领先成绩。论文指出,AI科学推理核心挑战在于知识与推理整合,并预示AI辅助科研新范式的到来。项目已开源,未来将拓展至更多领域。
原文链接
2025年9月,DeepSeek发布V3.1最终版(Terminus),修复了此前引发热议的“极你太美”随机输出Bug,并优化中英文混杂及异常字符问题。同时,Code Agent与Search Agent能力进一步提升,暗示其AI智能体发展方向。新版本评测显示输出更稳定,但部分场景如Codeforces竞赛表现略有下降,引发网友对安全调整影响性能的讨论。值得注意的是,“Terminus”命名引发猜测,或为V3系列收官之作,未来可能推出全新架构V4或R2版本。此前消息称,DeepSeek预计年底发布新模型,未来3个月或将有更多动态揭晓。模型已上线Hugging Face与ModelScope平台供下载。
原文链接
2025年9月5日,美团推出的开源大模型LongCat-Flash-Chat因“快如闪电”的响应速度引发关注,尤其在轻量问答场景中表现惊艳。然而,实测显示其推理能力存在明显短板,复杂问题回答时逻辑混乱、重点模糊,与DeepSeek-V3.1相比差距显著。DeepSeek在逻辑拆解和因果推理上表现更稳健,答案条理清晰且可信赖。实测表明,LongCat在速度上领先,单用户生成速度超100 tokens/秒,但推理场景下短板暴露无遗。行业观点认为,速度虽能带来短期惊艳,但逻辑才是模型赢得用户信任的关键。作为美团首款开源模型,LongCat在交互体验上有突破,但在高价值场景中仍有提升空间。
原文链接
2025年8月,DeepSeek V3.1模型因输出结果中频繁出现“极”字bug引发热议。该问题最初在火山引擎、chutes等平台被发现,随后波及腾讯CodeBuddy等多个平台,并在国外Reddit上引发讨论。开发者若未察觉此问题可能导致代码编译失败。官方回应称将在最近版本修复。网友分析认为,问题可能源于数据清洗不彻底或模型将“极”字误作终止符学习。目前可通过提示词缓解问题,但彻底解决需等待官方更新。
原文链接
2025年8月,DeepSeek V3.1模型因输出结果中频繁出现‘极’字引发全网热议。该问题最初在火山引擎、chutes等平台被发现,随后波及腾讯CodeBuddy等多个平台,甚至在国外Reddit上也引发讨论。此bug对需要高精度输出的场景造成严重影响,开发者若未察觉可能导致编译失败。官方回应称已联系DeepSeek团队,预计将在新版本修复。网友提出通过提示词缓解问题的方法,但需针对第三方平台使用。知乎网友黄哲威分析,问题或源于数据清洗不彻底,导致模型将‘极’字误用为终止符。具体修复时间待官方更新版本。
原文链接
8月26日,华泰证券发布研报称,DeepSeek-V3.1版本正式推出,采用UE8M0 FP8精度参数,具备高效能和大动态范围特点,并可避免信息损失。该版本专为下一代国产芯片设计,标志着国产软硬件协同取得显著成果。在海外GPU供应受限及国内互联网厂商资本开支增长的背景下,国产算力基础设施需求有望持续高景气。研报建议关注国产算力及其配套产业链,包括光模块、AIDC、交换机和铜连接等领域。
原文链接
8月25日,硅基流动宣布上线深度求索团队开源的DeepSeek-V3.1模型。该模型总参数达671B,激活参数37B,采用混合推理架构,思考效率更高,工具使用与智能体任务表现显著提升,性能在多项测试中比肩Claude 4 Sonnet等主流模型。新版本支持160K超长上下文,适用于长文档解析、多轮对话、复杂任务处理等场景,且成本仅为Claude 4 Sonnet输入的1/5、输出的1/9。此外,其最大支持500万TPM,可无损解析法律合同、学术文献等,并实现高精度RAG增强检索,大幅降低错误率。
原文链接
8月23日,火山引擎宣布DeepSeek-V3.1模型正式上线火山方舟平台,用户无需注册登录即可免费体验。该模型提供20-40ms超低延迟和500万初始并发TPM,性能与DeepSeek官方API高度一致。通过火山方舟体验中心的Canvas功能,用户可便捷测试网页编程能力,并支持一键跳转控制台完成模型调用配置,全程可视化操作大幅缩短开发链路。此外,火山引擎大模型应用实验室还推出了DeepSeek-V3.1的联网增强版本,进一步拓展应用场景。
原文链接
8月22日,腾讯元宝宣布正式接入DeepSeek V3.1最新版,电脑和网页端现已开放体验。此次更新带来两大核心突破:一是思考效率显著提升,能更快给出答案;二是增强了Agent能力,复杂任务处理更轻松。据深度求索官方介绍,新版本采用混合推理架构,支持思考与非思考模式自由切换,并通过优化大幅提升工具使用和智能体任务表现。目前,用户可通过“深度思考”按钮体验新模式功能。
原文链接
8月22日,腾讯云代码助手CodeBuddy国内版正式开启公测,用户可免费使用最新DeepSeek-V3.1模型,无需邀请码。CodeBuddy IDE旨在提供‘一个人变成一整个开发团队’的体验,支持产品设计、研发编码和部署验证等功能。产品设计支持通过一句话生成交互原型;研发编码内置Figma,可将设计稿快速转化为源码,并集成多种后端服务;部署验证可通过CloudStudio一键部署至沙箱环境并生成分享链接。Beta版已开放下载,为开发者提供高效便捷的全流程工具支持。
原文链接
加载更多

暂无内容