综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年1月,智谱AI发布开源轻量级大语言模型GLM-4.7-Flash,替代前代GLM-4.5-Flash,API免费开放调用。该模型采用混合专家(MoE)架构,总参数30B,仅激活3B,定位为本地编程与智能体助手,在SWE-bench代码修复测试中得分59.2,性能超越Qwen3-30B和GPT-OSS-20B。模型支持200K上下文窗口,首次引入DeepSeek的MLA架构,深度优化效率,适用于创意写作、翻译等多场景。发布不到12小时,HuggingFace等平台已提供支持,并兼容华为昇腾NPU。开发者实测显示,苹果M5芯片设备可实现43 token/s运行速度。官方API基础版免费,高速版价格低廉,但延迟和吞吐量有待优化。
原文链接
1月20日,智谱正式发布并开源GLM-4.7-Flash模型。该模型为混合思考模型,总参数量30B,激活参数量3B,现已在智谱开放平台BigModel.cn上线,供用户免费调用。GLM-4.7-Flash将替代上一代免费语言模型GLM-4.5-Flash,后者将于2026年1月30日下线,此后相关请求将自动路由至新模型。这一更新体现了智谱在大模型领域的持续创新与开源承诺。
原文链接
1月20日,智谱发布并开源了GLM-4.7-Flash模型,总参数量30B,激活参数量3B,主打轻量化部署,兼顾性能与效率。该模型在SWE-bench Verified、τ²-Bench等基准测试中表现优异,超越同级别开源模型,在编程及通用场景(如中文写作、翻译、长文本处理等)均有出色表现。即日起,GLM-4.7-Flash已上线智谱开放平台BigModel.cn,并免费开放调用。同时,上一代GLM-4.5-Flash将于2026年1月30日正式下线,相关请求将自动迁移至新版本。开源地址包括Hugging Face和魔搭社区。
原文链接
2026年1月20日,智谱AI正式发布并开源GLM-4.7-Flash模型。该模型为混合思考架构,总参数量30B,激活参数量3B,性能与效率兼备,是同级别中的SOTA模型,适合轻量化部署。即日起,GLM-4.7-Flash将取代GLM-4.5-Flash,在智谱开放平台BigModel.cn上线,并提供免费调用服务。这一更新为开发者和企业提供了更高效的解决方案。(记者 李明明)
原文链接
加载更多
暂无内容