综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2月13日,野村证券发布AI主题研报,聚焦DeepSeek即将推出的新一代旗舰大语言模型V4。研报指出,DS-V4的技术突破将打破“芯片墙”与“内存墙”的限制,推动中国AI产业链创新加速,并缩小与全球大模型产业的差距。此次技术布局有望赋能本土算力硬件与AI应用双向发展,助力中国开源大模型生态成熟。作为去年推出DS-V3/R1并引发全球关注的企业,DeepSeek此次发布或再次搅动AI行业格局。
原文链接
在2025年7月31日的ACL 2025颁奖典礼上,DeepSeek与北京大学联合发表的论文荣获*论文奖。其提出的原生稀疏注意力(NSA)机制通过算法与硬件协同优化,将长文本处理速度提升11倍,且性能超越传统全注意力模型。一作袁境阳透露,该技术可扩展上下文至1百万tokens,可能应用于下一代DeepSeek-V4及DeepSeek-R2模型。研究显示,NSA在多项基准测试中表现优异,尤其在复杂推理和长文本任务中显著领先。此外,会议还评选出其他三篇*论文,分别聚焦语言模型对齐弹性、公平性差异感知及大模型采样机制理论,为AI领域带来新洞见。
原文链接
加载更多
暂无内容