1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2月18日,DeepSeek和月之暗面几乎同时发布了关于改进Transformer架构注意力机制的最新论文。DeepSeek提出的NSA架构在处理长上下文时速度提升至11.6倍,而月之暗面的MoBA架构在1M token测试中比全注意力快6.5倍。两家公司创始人杨植麟和梁文锋分别参与了这两项研究,显示出其对公司技术路线的重要影响。此次‘撞车’现象不仅展示了技术发展的相似趋势,也为理解强化学习和高效长文本处理提供了新视角。

原文链接
本文链接:https://kx.umi6.com/article/13760.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
梁文锋,Nature全球年度十大科学人物!
2025-12-09 10:25:17
六大AI拿1万美元真实交易:DeepSeek最能赚,GPT-5亏麻了,AI能让周杰伦少亏上亿
2025-10-20 17:12:32
梁文锋出资200亿!DeepSeek首轮创纪录融资500亿,V4.1定档6月
2026-05-09 11:07:00
独家|月之暗面Kimi融资获国资加持 国智投等多家基金入场
2026-05-19 15:42:31
月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%
2025-11-27 16:43:04
DeepSeek:特殊字符引发模型幻觉 不涉及安全问题或隐私泄露
2026-05-19 19:54:37
DeepSeek发布梁文锋署名新论文 开源相关记忆模块Engram
2026-01-13 09:25:44
Similarweb 报告 13 日全球 AI 流量:Gemini 成 ChatGPT 最强劲对手,DeepSeek 正收复失地
2025-11-15 12:48:52
DeepSeek网页及API相关服务已恢复
2026-05-08 19:36:09
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
MAU被豆包反超,Deepseek挤了点牙膏
2025-10-21 15:28:27
DeepSeek 输入缓存降价
2026-04-26 23:42:34
DeepSeek上线识图模式
2026-04-29 18:38:04
24小时热文
更多
扫一扫体验小程序