1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月3日,上海AI实验室开源多模态大模型书生・万象3.5(InternVL3.5),参数覆盖10亿至2410亿,适用于多种场景。旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获77.7分,超越GPT-5的多模态感知能力,并领跑开源文本能力。相比上一代,新版本在GUI交互、具身空间感知和矢量图形生成等任务显著提升。其GUI交互性能达92.9分,Windows自动化操作领先Claude-3.7-Sonnet;具身智能体测试中路径规划能力超Gemini-2.5-Pro;矢量图形生成刷新开源纪录。此外,InternVL3.5支持跨平台操作,具备复杂场景泛化能力,助力机器人高效完成物理交互任务。目前全系列下载量突破2300万次,相关代码与模型已开源。

原文链接
本文链接:https://kx.umi6.com/article/24666.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-4.5 创造力比 GPT-4o 弱,浙大上海 AI Lab 发布全球首个面向真实场景的多模态创造力评测基准
2025-04-04 13:13:45
张宏江消除“Scaling Law放缓”恐惧,直言未来将迎来“自主智能”的世界
2024-12-07 17:49:03
网易云音乐创始人再创业、全灵完成千万美元 Pre-A 轮融资,称将发布全球首个 AI 游戏生成平台
2024-11-18 20:29:26
对话式AI即将爆发!将在手机助手、陪伴机器人、学习机等场景率先落地
2025-03-08 22:12:53
CVPR2025视频生成统一评估架构,上交x斯坦福联合提出让MLLM像人类一样打分
2025-06-12 17:39:33
阶跃星辰走「窄门」
2025-06-12 18:36:57
多模态大模型不会画辅助线?最新评估得分:o3仅25.8%,远低于人类82.3% | 清华腾讯斯坦福联合
2025-05-28 16:33:14
多模态大模型的多语种文字理解能力还有很长的路要走,字节、华科联合发布MTVQA Bench
2024-06-21 17:23:05
「生数科技」完成数亿元Pre-A轮融资,百度投了 | 36氪首发
2024-06-06 16:27:59
腾讯微信正式发布多模态大模型 POINTS 1.5
2024-12-16 09:34:39
让「GPT-4V」跑在手机上,这家中国大模型公司做到了
2024-08-07 11:18:02
上海人工智能实验室开源多模态大模型书生·万象3.0
2025-04-17 12:40:23
阶跃星辰两款开源模型均位列 Hugging Face榜单Top 5
2025-02-25 12:57:29
24小时热文
更多
扫一扫体验小程序