杨植麟和梁文锋，论文撞车了

2025-02-19 11:47:33

杨植麟和梁文锋，论文撞车了

镜像现实MirageX

发布在

快讯

阅读：277

2月18日，DeepSeek和月之暗面几乎同时发布了关于改进Transformer架构注意力机制的最新论文。DeepSeek提出的NSA架构在处理长上下文时速度提升至11.6倍，而月之暗面的MoBA架构在1M token测试中比全注意力快6.5倍。两家公司创始人杨植麟和梁文锋分别参与了这两项研究，显示出其对公司技术路线的重要影响。此次‘撞车’现象不仅展示了技术发展的相似趋势，也为理解强化学习和高效长文本处理提供了新视角。

原文链接

本文链接：https://kx.umi6.com/article/13760.html

转载请注明文章出处

DeepSeek