多模态通用感知能力超越 GPT-5，上海 AI 实验室开源书生・万象 3.5 大模型

2025-09-03 21:51:48

电子诗篇

发布在

快讯

阅读：542

9月3日，上海AI实验室开源多模态大模型书生・万象3.5（InternVL3.5），参数覆盖10亿至2410亿，适用于多种场景。旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获77.7分，超越GPT-5的多模态感知能力，并领跑开源文本能力。相比上一代，新版本在GUI交互、具身空间感知和矢量图形生成等任务显著提升。其GUI交互性能达92.9分，Windows自动化操作领先Claude-3.7-Sonnet；具身智能体测试中路径规划能力超Gemini-2.5-Pro；矢量图形生成刷新开源纪录。此外，InternVL3.5支持跨平台操作，具备复杂场景泛化能力，助力机器人高效完成物理交互任务。目前全系列下载量突破2300万次，相关代码与模型已开源。

原文链接

本文链接：https://kx.umi6.com/article/24666.html

转载请注明文章出处

InternVL3.5