1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2026年2月9日,小米MiMo团队推出面向Agent时代的混合稀疏注意力架构HySparse,采用“极少全注意力+稀疏注意力”设计,为超长文本处理提供高效解决方案。随着Agent模型快速发展,精准处理超长上下文成为关键挑战,不仅需稳定检索与推理,还需快速响应。HySparse在7B和80B模型规模中均表现优异,在80B-A3BMoE实验中,仅保留5层全注意力即可提升性能并降低KV Cache存储近10倍。RULER测试显示其能稳定访问长距离信息,兼顾效果与效率。该架构是MiMo-V2-Flash的升级版,兼容且互补,未增加计算开销。小米MiMo计划进一步验证其潜力,推动学术与工业界研究。

原文链接
本文链接:https://kx.umi6.com/article/32769.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
小米开源“Xiaomi MiMo”大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini
2025-04-30 19:37:14
小米 MiMo 模型 API 平台开放充值功能:输入 0.7 元 / M tokens,新老用户可领取免费额度
2026-01-20 18:21:55
小米首个推理大模型开源
2025-04-30 20:36:34
小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构
2026-02-07 19:19:57
小米MiMo推出HySparse:面向Agent时代的混合稀疏注意力架构
2026-02-09 14:13:10
平民本地AI神器!苹果M4 Mac mini面临缺货
2026-02-08 23:35:44
清华研究生开源大一统世界模型:性能超越硅谷标杆40%!
2026-02-07 22:25:40
云器科技完成B轮融资,加码AI时代的新数据基建
2026-02-07 09:51:21
国际能源署:可再生能源与核电2030年将提供全球一半电力
2026-02-07 15:07:15
OpenAI和Anthropic深夜同发大招
2026-02-07 09:54:47
可灵3.0加入AI拜年战场!人在工位搓好莱坞大片,分镜逻辑封神
2026-02-07 19:18:40
特斯拉中国AI训练中心已投入使用
2026-02-06 20:13:16
AI看图一本正经胡说八道?「一拉一推」让模型看得全又准|微软x清华
2026-02-08 15:11:38
24小时热文
更多
扫一扫体验小程序