8月11日,智谱AI发布全球100B级效果最佳的开源视觉推理模型GLM-4.5V(总参数106B,激活参数12B),并在魔搭社区与Hugging Face同步开源。该模型基于GLM-4.5-Air,综合性能在41个视觉多模态榜单中达同级别SOTA水平,涵盖图像、视频、文档理解等任务。新增“思考模式”开关,可灵活选择快速响应或深度推理,并支持全场景视觉推理,如复杂图表分析、长视频分镜处理等。同时,智谱AI开源一款桌面助手应用,可实时截屏、录屏并依托GLM-4.5V完成代码辅助、文档解读等任务,旨在赋能开发者打造多模态应用场景,将科幻变为现实。API调用价格低至输入2元/M tokens,输出6元/M tokens。
原文链接
本文链接:https://kx.umi6.com/article/23394.html
转载请注明文章出处
相关推荐
换一换
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025-12-01 15:15:24
三家混战,大模型重回2023
2025-08-03 11:35:50
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
智谱开源GLM-OCR模型
2026-02-03 09:27:36
腾讯混元开源视频音效生成模型
2025-08-28 16:29:54
业界首个,腾讯混元 3D 世界模型正式发布并开源
2025-07-27 11:55:13
蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0
2025-12-12 15:57:42
阶跃星辰全面开源 Step 3.5 Flash:预训练+训练框架全放出 冲上 OpenClaw Top2
2026-03-04 10:34:06
智谱开源GLM-4.7-Flash模型
2026-01-20 16:17:32
41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码
2025-08-12 16:19:29
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
千问语音识别模型Qwen3-ASR开源!饶舌RAP歌曲也能轻松识别
2026-01-30 11:21:16
阿里新一代模型Qwen3.5曝光
2026-02-09 13:10:49
634 文章
451179 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18