2026年2月9日,小米MiMo团队推出面向Agent时代的混合稀疏注意力架构HySparse,采用“极少全注意力+稀疏注意力”设计,为超长文本处理提供高效解决方案。随着Agent模型快速发展,精准处理超长上下文成为关键挑战,不仅需稳定检索与推理,还需快速响应。HySparse在7B和80B模型规模中均表现优异,在80B-A3BMoE实验中,仅保留5层全注意力即可提升性能并降低KV Cache存储近10倍。RULER测试显示其能稳定访问长距离信息,兼顾效果与效率。该架构是MiMo-V2-Flash的升级版,兼容且互补,未增加计算开销。小米MiMo计划进一步验证其潜力,推动学术与工业界研究。
原文链接
本文链接:https://kx.umi6.com/article/32769.html
转载请注明文章出处
相关推荐
换一换
小米MiMo大模型首次推出Token Plan,单次订阅可满足全模态Agent任务需求
2026-04-03 14:21:37
小米首个推理大模型开源
2025-04-30 20:36:34
小米MiMo大模型负责人罗福莉:AI通过“自进化”创造新东西
2026-03-27 17:14:18
小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构
2026-02-07 19:19:57
小米开源“Xiaomi MiMo”大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini
2025-04-30 19:37:14
小米 MiMo 模型 API 平台开放充值功能:输入 0.7 元 / M tokens,新老用户可领取免费额度
2026-01-20 18:21:55
上海:一季度全市三大先导产业制造领域产值同比增长16.1%
2026-04-22 17:32:28
特斯拉CFO:今年将豪掷250亿美元 押注AI与机器人
2026-04-23 11:04:57
两部门:重点在软件和信息服务、数字交付贸易的数据安全与隐私保护、数据要素跨境流动、数字贸易平台建设等方面率先推进标准研制和体系建设
2026-04-23 12:05:12
国家知识产权局:将积极完善新兴领域知识产权保护制度
2026-04-23 17:20:53
河南师傅,左手扳手,右手飞书,竟然能搞数据分析!
2026-04-23 23:34:55
斑马智能接入支付宝AI付车载版 打通AI座舱“支付即服务”
2026-04-24 17:25:23
Nature封面:机器人乒乓球干翻人类职业选手
2026-04-23 15:11:01
725 文章
559163 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38