
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
9月3日,上海AI实验室开源多模态大模型书生・万象3.5(InternVL3.5),参数覆盖10亿至2410亿,适用于多种场景。旗舰模型InternVL3.5-241B-A28B在多学科推理基准MMMU中获77.7分,超越GPT-5的多模态感知能力,并领跑开源文本能力。相比上一代,新版本在GUI交互、具身空间感知和矢量图形生成等任务显著提升。其GUI交互性能达92.9分,Windows自动化操作领先Claude-3.7-Sonnet;具身智能体测试中路径规划能力超Gemini-2.5-Pro;矢量图形生成刷新开源纪录。此外,InternVL3.5支持跨平台操作,具备复杂场景泛化能力,助力机器人高效完成物理交互任务。目前全系列下载量突破2300万次,相关代码与模型已开源。
原文链接
商汤科技在CVPR 2024上亮眼亮相,共50篇论文入选,其中9篇被选为 Oral 和 Highlight。亮点包括60亿参数的视觉语言基础模型InternVL,展示了在通用视觉语言任务中的领先性能,以及RegionPLC,一种无需额外训练的3D开放世界理解算法,助力机器人自主导航。此外,商汤的“数字生命计划”展示了自主3D虚拟角色的社交交互能力。CVPR 2024于美国西雅图举行,录用率23.6%,腾讯优图实验室也有20篇论文入选。CVPR最佳论文奖即将揭晓,关注行业动态。
原文链接
加载更多

暂无内容