9月3日,上海AI实验室开源多模态大模型书生・万象3.5(InternVL3.5),参数覆盖10亿至2410亿,适用于多种场景。旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获77.7分,超越GPT-5的多模态感知能力,并领跑开源文本能力。相比上一代,新版本在GUI交互、具身空间感知和矢量图形生成等任务显著提升。其GUI交互性能达92.9分,Windows自动化操作领先Claude-3.7-Sonnet;具身智能体测试中路径规划能力超Gemini-2.5-Pro;矢量图形生成刷新开源纪录。此外,InternVL3.5支持跨平台操作,具备复杂场景泛化能力,助力机器人高效完成物理交互任务。目前全系列下载量突破2300万次,相关代码与模型已开源。
原文链接
本文链接:https://kx.umi6.com/article/24666.html
转载请注明文章出处
相关推荐
换一换
上海人工智能实验室开源多模态大模型“书生・万象 3.0”:能同时处理文本和多模态输入
2025-04-17 13:36:40
多模态通用感知能力超越 GPT-5,上海 AI 实验室开源书生・万象 3.5 大模型
2025-09-03 21:51:48
李飞飞谢赛宁新作「空间推理」:多模态大模型性能突破关键所在
2024-12-23 12:52:12
生数科技再获数亿元大额融资,Vidu领跑多模态大模型赛道
2025-09-19 11:12:21
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
2024-11-28 15:29:46
刚刚,小红书开源了首个多模态大模型dots.vlm1,性能直追SOTA!
2025-08-08 16:14:57
前微软亚研院视觉专家胡瀚加入腾讯 负责混元多模态大模型
2025-01-08 15:42:57
挑战高考数学完胜!商汤日日新多模态大模型权威评测第一
2024-12-19 20:05:26
多模态大模型学会反思和复盘,上交&上海AI Lab破解多模态复杂推理
2025-10-19 15:52:40
阶跃星辰联合吉利首次开源 Step 系列多模态大模型,包含视频、语音两款模型
2025-02-18 11:13:42
网易云音乐创始人再创业、全灵完成千万美元 Pre-A 轮融资,称将发布全球首个 AI 游戏生成平台
2024-11-18 20:29:26
我国发布全球首个深海生境智能多模态大模型
2025-11-06 21:14:23
「生数科技」完成数亿元Pre-A轮融资,百度投了 | 36氪首发
2024-06-06 16:27:59
567 文章
322191 浏览
24小时热文
更多
-
2025-12-07 22:52:28 -
2025-12-07 22:51:22 -
2025-12-07 21:52:07