2025年7月,智谱开源了仅9B大小的视觉语言模型GLM-4.1V-9B-Thinking,在28项评测中斩获23个SOTA,成为10B级别中效果最好的VLM模型。该模型在18项评测中表现超越参数量达其8倍的Qwen-2.5-VL-72B,核心优势在于引入了思维链(Chain-of-Thought)推理机制和课程采样强化学习(RLCS)。浦东创投集团和张江集团已对该项目投资10亿元,首笔资金将近期到位。GLM-4.1V-9B-Thinking具备多模态深度推理能力,可处理超长视频解析、智能读图问答、理科解题、专业文档处理等任务,并已在数学题解答、图像分析等场景中展现优异表现。相关论文、代码及模型已开源,详见arXiv与各大平台链接。
原文链接
本文链接:https://kx.umi6.com/article/21072.html
转载请注明文章出处
相关推荐
.png)
换一换
谷歌研究人员发论文揭示:GenAI正用虚假内容侵蚀互联网
2024-07-06 06:32:32
消息称谷歌因 Meta 投资欲与 Scale AI 终止合作,AI 竞赛加剧巨头矛盾
2025-06-16 23:14:47
匆忙接入DeepSeek,你想好怎么收费了么?
2025-04-14 17:45:27
450 文章
82376 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21