8月11日,智谱AI发布全球100B级效果最佳的开源视觉推理模型GLM-4.5V(总参数106B,激活参数12B),并在魔搭社区与Hugging Face同步开源。该模型基于GLM-4.5-Air,综合性能在41个视觉多模态榜单中达同级别SOTA水平,涵盖图像、视频、文档理解等任务。新增“思考模式”开关,可灵活选择快速响应或深度推理,并支持全场景视觉推理,如复杂图表分析、长视频分镜处理等。同时,智谱AI开源一款桌面助手应用,可实时截屏、录屏并依托GLM-4.5V完成代码辅助、文档解读等任务,旨在赋能开发者打造多模态应用场景,将科幻变为现实。API调用价格低至输入2元/M tokens,输出6元/M tokens。
原文链接
本文链接:https://kx.umi6.com/article/23394.html
转载请注明文章出处
相关推荐
换一换
百度文心大模型4.5系列正式开源 同步开放API服务
2025-06-30 11:47:18
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
2025-09-29 20:14:51
小扎改口不开源,Meta股价暴涨12%
2025-08-01 08:56:20
大模型套壳往事
2025-07-14 18:26:03
兑现承诺!马斯克旗下xAI宣布Grok 2.5正式开源
2025-08-25 16:33:11
阿里开源视觉理解模型Qwen3-VL
2025-09-24 14:43:41
睿尔曼开源全球首个高质量、模态数量最多的真机数据集
2025-11-24 20:12:19
2025外滩大会:蚂蚁、人大发布首个原生MoE扩散语言模型,将于近期开源
2025-09-12 10:08:55
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
谷歌太壕了!编程Agent大招至简:开源且免费,百万上下文、多模态、MCP全支持
2025-06-26 10:56:45
Coze/Dify/FastGPT/N8N :该如何选择Agent平台?
2025-06-09 10:25:58
576 文章
345269 浏览
24小时热文
更多
-
2025-12-08 19:45:13 -
2025-12-08 19:43:05 -
2025-12-08 18:41:52