综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年11月,Meta MSL实验室发布SAM 3D模型,将图像分割结果直接转换为3D模型,支持物体与场景重建,即使有遮挡也能复原。该模型家族包括SAM 3D Objects和SAM 3D Body,前者适用于多种物体与密集场景,后者专注于人体复杂姿态建模,均达到SOTA性能。同时发布的SAM 3分割模型增强语义理解,可通过文本或示例提示分割细微概念,如“红色条纹伞”,并刷新多项基准测试记录。Meta还推出SA-3DAO数据集用于评估物理世界三维重建能力。项目已开源,相关论文和代码可在Meta官网及GitHub获取。
原文链接
用两个简单模块实现分割理解双重SOTA!华科大白翔团队推出多模态新框架
多模态大模型的能力已从文生图扩展到像素级任务(如图像分割)。然而,现有方法如OMG-LLaVA和LISA(CVPR 2024)仍存在分割不精确和理解幻觉的问题。为解决这些问题,华中科技大学与金山办公团队联合提出了多模态大模型LI...
原文链接
加载更多
暂无内容