1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2月18日,DeepSeek和月之暗面几乎同时发布了关于改进Transformer架构注意力机制的最新论文。DeepSeek提出的NSA架构在处理长上下文时速度提升至11.6倍,而月之暗面的MoBA架构在1M token测试中比全注意力快6.5倍。两家公司创始人杨植麟和梁文锋分别参与了这两项研究,显示出其对公司技术路线的重要影响。此次‘撞车’现象不仅展示了技术发展的相似趋势,也为理解强化学习和高效长文本处理提供了新视角。

原文链接
本文链接:https://kx.umi6.com/article/13760.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Kimi母公司拟赴港借壳上市?接近月之暗面人士:假消息
2025-12-31 20:40:13
DeepSeek官方点赞元宝,罕见现身互动
2025-12-24 17:46:41
独家|月之暗面正在敲定新一轮融资 投前估值上升至48亿美元
2026-01-20 00:25:53
AI实盘操作,DeepSeek暴赚,Gemini崩盘,网友:专业对口就是不一样
2025-10-20 21:13:47
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
月之暗面杨植麟:大模型训练进入第三个阶段 今年起AI研发会逐渐加速
2026-03-25 12:30:36
DeepSeek 线上模型升级至 V3.1-Terminus 版本,改进语言一致性及 Agent 能力
2025-09-22 21:02:17
Kimi完成5亿美元C轮融资 账面现金超百亿
2025-12-31 16:39:47
六大AI模型被扔进加密市场厮杀,DeepSeek暂为交易之王
2025-10-20 18:12:39
月之暗面或启动新一轮融资 估值将达40亿美元
2025-11-21 21:44:55
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布
2026-01-21 09:02:53
DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus
2025-09-22 21:05:30
DeepSeek连更GitHub 华尔街回想起被支配的恐惧
2026-02-24 15:51:36
24小时热文
更多
扫一扫体验小程序