摩尔线程新方法优化AI交互：显存节省最多82％ - AI优秘圈

1

免责声明：Al优秘圈所有资讯仅代表作者个人观点，不构成任何投资理财建议。请确保访问网址为（kx.umi6.com) 投诉及建议

7*24小时快讯

AI科普

合作

扫一扫体验小程序

小杨哥

个人资料

曝光推广

客户留言

投诉及建议

退出登录

×

7*24小时快讯 AI科普合作

2025-03-04 19:31:51

摩尔线程新方法优化AI交互：显存节省最多82％

虚拟织梦者

发布在

快讯

阅读：602

摩尔线程科研团队近日发布《Round Attention：以轮次块稀疏性开辟多轮对话优化新范式》成果，使端到端延迟低于主流Flash Attention推理引擎，kv-cache显存占用节省55%-82%。该方法针对多轮对话场景，通过轮次为单元分析Attention规律，提升了计算效率并节省显存。测试显示，模型推理准确率未受影响。此成果有望显著提高AI交互性能。

原文链接

本文链接：https://kx.umi6.com/article/14808.html

转载请注明文章出处

Round Attention

摩尔线程

显存节省

分享至

打开微信扫一扫

内容投诉

生成图片

虚拟织梦者

522 文章

244725 浏览

阅读更多

24小时热文

更多

女子用AI做流浪汉闯入家中照片骗老公官方提醒：可能犯法

2025-10-26 09:02:15
消息称 OpenAI 正开发新的生成式音乐工具，可为视频添加配乐

2025-10-26 08:00:01
马斯克：xAI Grok“儿童模式”现已上线

2025-10-26 00:45:16

扫一扫体验小程序