GLM-4.7-Flash - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

智谱新模型也用DeepSeek的MLA，苹果M5就能跑

2026年1月，智谱AI发布开源轻量级大语言模型GLM-4.7-Flash，替代前代GLM-4.5-Flash，API免费开放调用。该模型采用混合专家（MoE）架构，总参数30B，仅激活3B，定位为本地编程与智能体助手，在SWE-bench代码修复测试中得分59.2，性能超越Qwen3-30B和GPT-OSS-20B。模型支持200K上下文窗口，首次引入DeepSeek的MLA架构，深度优化效率，适用于创意写作、翻译等多场景。发布不到12小时，HuggingFace等平台已提供支持，并兼容华为昇腾NPU。开发者实测显示，苹果M5芯片设备可实现43 token/s运行速度。官方API基础版免费，高速版价格低廉，但延迟和吞吐量有待优化。

原文链接

智能视野

01-20 18:20:48

GLM-4.7-Flash

MLA架构

智谱AI

分享至

打开微信扫一扫

内容投诉

生成图片

智谱开源GLM-4.7-Flash模型

1月20日，智谱正式发布并开源GLM-4.7-Flash模型。该模型为混合思考模型，总参数量30B，激活参数量3B，现已在智谱开放平台BigModel.cn上线，供用户免费调用。GLM-4.7-Flash将替代上一代免费语言模型GLM-4.5-Flash，后者将于2026年1月30日下线，此后相关请求将自动路由至新模型。这一更新体现了智谱在大模型领域的持续创新与开源承诺。

原文链接

代码编织者

01-20 16:17:32

GLM-4.7-Flash

开源

智谱

分享至

打开微信扫一扫

内容投诉

生成图片

智谱 GLM-4.7-Flash 模型发布并开源，可免费调用

1月20日，智谱发布并开源了GLM-4.7-Flash模型，总参数量30B，激活参数量3B，主打轻量化部署，兼顾性能与效率。该模型在SWE-bench Verified、τ²-Bench等基准测试中表现优异，超越同级别开源模型，在编程及通用场景（如中文写作、翻译、长文本处理等）均有出色表现。即日起，GLM-4.7-Flash已上线智谱开放平台BigModel.cn，并免费开放调用。同时，上一代GLM-4.5-Flash将于2026年1月30日正式下线，相关请求将自动迁移至新版本。开源地址包括Hugging Face和魔搭社区。

原文链接

神经网络领航员

01-20 09:47:20

GLM-4.7-Flash

开源

智谱

分享至

打开微信扫一扫

内容投诉

生成图片

智谱GLM-4.7-Flash正式发布并开源

2026年1月20日，智谱AI正式发布并开源GLM-4.7-Flash模型。该模型为混合思考架构，总参数量30B，激活参数量3B，性能与效率兼备，是同级别中的SOTA模型，适合轻量化部署。即日起，GLM-4.7-Flash将取代GLM-4.5-Flash，在智谱开放平台BigModel.cn上线，并提供免费调用服务。这一更新为开发者和企业提供了更高效的解决方案。（记者李明明）

原文链接

神经网络领航员

01-20 08:45:53

开源

智谱GLM-4.7-Flash

轻量化部署

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多