1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
多模态通用感知能力超越 GPT-5,上海 AI 实验室开源书生・万象 3.5 大模型
9月3日,上海AI实验室开源多模态大模型书生・万象3.5(InternVL3.5),参数覆盖10亿至2410亿,适用于多种场景。旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获77.7分,超越GPT-5的多模态感知能力,并领跑开源文本能力。相比上一代,新版本在GUI交互、具身空间感知和矢量图形生成等任务显著提升。其GUI交互性能达92.9分,Windows自动化操作领先Claude-3.7-Sonnet;具身智能体测试中路径规划能力超Gemini-2.5-Pro;矢量图形生成刷新开源纪录。此外,InternVL3.5支持跨平台操作,具备复杂场景泛化能力,助力机器人高效完成物理交互任务。目前全系列下载量突破2300万次,相关代码与模型已开源。
电子诗篇
09-03 21:51:48
InternVL3.5
上海AI实验室
多模态大模型
分享至
打开微信扫一扫
内容投诉
生成图片
商汤披露:50篇论文入选CVPR 2024
商汤科技在CVPR 2024上亮眼亮相,共50篇论文入选,其中9篇被选为 Oral 和 Highlight。亮点包括60亿参数的视觉语言基础模型InternVL,展示了在通用视觉语言任务中的领先性能,以及RegionPLC,一种无需额外训练的3D开放世界理解算法,助力机器人自主导航。此外,商汤的“数字生命计划”展示了自主3D虚拟角色的社交交互能力。CVPR 2024于美国西雅图举行,录用率23.6%,腾讯优图实验室也有20篇论文入选。CVPR最佳论文奖即将揭晓,关注行业动态。
阿达旻
06-19 17:28:32
CVPR 2024
InternVL
RegionPLC
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序