MLA架构 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

智谱新模型也用DeepSeek的MLA，苹果M5就能跑

2026年1月，智谱AI发布开源轻量级大语言模型GLM-4.7-Flash，替代前代GLM-4.5-Flash，API免费开放调用。该模型采用混合专家（MoE）架构，总参数30B，仅激活3B，定位为本地编程与智能体助手，在SWE-bench代码修复测试中得分59.2，性能超越Qwen3-30B和GPT-OSS-20B。模型支持200K上下文窗口，首次引入DeepSeek的MLA架构，深度优化效率，适用于创意写作、翻译等多场景。发布不到12小时，HuggingFace等平台已提供支持，并兼容华为昇腾NPU。开发者实测显示，苹果M5芯片设备可实现43 token/s运行速度。官方API基础版免费，高速版价格低廉，但延迟和吞吐量有待优化。

原文链接