1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

摩尔线程科研团队近日发布《Round Attention:以轮次块稀疏性开辟多轮对话优化新范式》成果,使端到端延迟低于主流Flash Attention推理引擎,kv-cache显存占用节省55%-82%。该方法针对多轮对话场景,通过轮次为单元分析Attention规律,提升了计算效率并节省显存。测试显示,模型推理准确率未受影响。此成果有望显著提高AI交互性能。

原文链接
本文链接:https://kx.umi6.com/article/14808.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
摩尔线程的野心,不藏了
2025-12-21 23:07:27
摩尔线程科创板IPO上会在即 联美控股收盘三连板 十余家上市公司互动易回复参股投资
2025-09-25 15:07:35
投资界24h | 徐新买了字节老股;瑞幸揭开IDG另一张版图;年底最大IPO:摩尔线程开启打新
2025-11-21 09:08:18
摩尔线程率先支持腾讯混元-A13B 模型,完成全功能 GPU 深度适配
2025-06-29 18:32:47
摩尔线程发布新一代GPU架构花港 支持10万卡以上规模智算集群
2025-12-20 11:47:38
摩尔线程及中介机构回复第二轮审核问询函
2025-09-18 15:58:01
“中国版英伟达”闪电过会,从受理到过会仅用时88天
2025-09-28 13:54:28
摩尔线程发布AI算力笔记本MTT AIBOOK 预售价9999元
2025-12-20 12:49:52
首个国产全功能GPU的万卡集群来了!“中国英伟达”出品
2024-07-04 20:43:24
摩尔线程携手硅基流动实现DeepSeek-V3大模型高性能推理
2026-01-21 20:31:18
摩尔线程:与师者 AI 完成 70 亿参数教育大模型训练测试
2024-06-14 14:15:12
估值255亿!“中国英伟达”GPU独角兽摩尔线程启动IPO上市辅导
2024-11-13 07:26:24
寒武纪、摩尔线程完成对智谱 GLM-4.6 的适配,国产大模型与国产芯片协同进入新阶段
2025-09-30 18:30:45
24小时热文
更多
扫一扫体验小程序