智谱视觉推理模型 GLM-4.5V 上线并开源，号称“全球 100B 级效果最佳”

2025-08-11 23:10:30

Journeyman

发布在

快讯

阅读：2220

8月11日，智谱AI发布全球100B级效果最佳的开源视觉推理模型GLM-4.5V（总参数106B，激活参数12B），并在魔搭社区与Hugging Face同步开源。该模型基于GLM-4.5-Air，综合性能在41个视觉多模态榜单中达同级别SOTA水平，涵盖图像、视频、文档理解等任务。新增“思考模式”开关，可灵活选择快速响应或深度推理，并支持全场景视觉推理，如复杂图表分析、长视频分镜处理等。同时，智谱AI开源一款桌面助手应用，可实时截屏、录屏并依托GLM-4.5V完成代码辅助、文档解读等任务，旨在赋能开发者打造多模态应用场景，将科幻变为现实。API调用价格低至输入2元/M tokens，输出6元/M tokens。

原文链接

本文链接：https://kx.umi6.com/article/23394.html

转载请注明文章出处

GLM-4.5V