综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年1月,智谱AI发布开源轻量级大语言模型GLM-4.7-Flash,替代前代GLM-4.5-Flash,API免费开放调用。该模型采用混合专家(MoE)架构,总参数30B,仅激活3B,定位为本地编程与智能体助手,在SWE-bench代码修复测试中得分59.2,性能超越Qwen3-30B和GPT-OSS-20B。模型支持200K上下文窗口,首次引入DeepSeek的MLA架构,深度优化效率,适用于创意写作、翻译等多场景。发布不到12小时,HuggingFace等平台已提供支持,并兼容华为昇腾NPU。开发者实测显示,苹果M5芯片设备可实现43 token/s运行速度。官方API基础版免费,高速版价格低廉,但延迟和吞吐量有待优化。
原文链接
加载更多
暂无内容