综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年11月,Meta MSL实验室发布SAM 3D模型,将图像分割结果直接转换为3D模型,支持物体与场景重建,即使有遮挡也能复原。该模型家族包括SAM 3D Objects和SAM 3D Body,前者适用于多种物体与密集场景,后者专注于人体复杂姿态建模,均达到SOTA性能。同时发布的SAM 3分割模型增强语义理解,可通过文本或示例提示分割细微概念,如“红色条纹伞”,并刷新多项基准测试记录。Meta还推出SA-3DAO数据集用于评估物理世界三维重建能力。项目已开源,相关论文和代码可在Meta官网及GitHub获取。
原文链接
谢赛宁盛赞字节Seed新研究!单Transformer搞定任意视图3D重建
闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
字节跳动Seed团队推出全新研究成果——Depth Anything 3(简称DA3),仅用一个Transformer模型即可实现从单张图片、多视角照片甚至视频中完成...
原文链接
10月22日,腾讯混元发布并开源混元世界模型1.1版本(WorldMirror)。新版本支持多视图及视频输入,单卡即可部署,可秒级生成3D世界。相比7月发布的1.0版本,1.1版突破了仅支持文本或单图输入的局限,首次实现多模态先验注入与多任务统一输出,支持点云、深度、相机等多种3D几何预测。模型已完全开源,开发者可通过GitHub一键部署,普通用户也可在HuggingFace Space在线体验实时3D渲染功能。相关资源已在官网及技术报告中提供。
原文链接
5月13日,苹果机器学习团队联合南京大学和香港科技大学推出Matrix3D,一款专注于从少量2D照片生成高质量3D重建的AI模型。传统摄影测量需多个独立模型处理姿态估计和深度预测,而Matrix3D通过整合图像、相机参数及深度数据,采用统一架构简化流程,大幅降低错误率并提高效率。其训练采用掩码学习法,类似ChatGPT早期版本,使模型在数据不足时仍能高效学习。测试显示,仅用3张输入图片即可生成详细3D重建,适用于Apple Vision Pro等头显设备,为元宇宙和AR发展带来新可能。
原文链接
标题:扩散模型还原被遮挡物体,几张稀疏照片也能“脑补”完整重建交互式3D场景|CVPR’25
北京通用人工智能研究院联合清华大学、北京大学的研究团队提出DP-Recon方法,利用生成式扩散模型解决稀疏视角下3D场景重建难题。传统方法难以还原被遮挡区域,而DP-Recon通过组合式重建策略和可见性...
原文链接
加载更多
暂无内容