综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
9B端侧开源模型跑通百万上下文,面壁智能推出全新稀疏-线性混合注意力架构SALA
近日,面壁智能发布了一种全新的稀疏-线性混合注意力架构SALA(Sparse Attention-Linear Attention),成功让9B参数量的端侧模型在消费级5090显卡上处理百万级上下文。基于该架构的模型M...
原文链接
加载更多
暂无内容