3D重建 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

Meta「分割一切」进入3D时代！图像分割结果直出3D，有遮挡也能复原

2025年11月，Meta MSL实验室发布SAM 3D模型，将图像分割结果直接转换为3D模型，支持物体与场景重建，即使有遮挡也能复原。该模型家族包括SAM 3D Objects和SAM 3D Body，前者适用于多种物体与密集场景，后者专注于人体复杂姿态建模，均达到SOTA性能。同时发布的SAM 3分割模型增强语义理解，可通过文本或示例提示分割细微概念，如“红色条纹伞”，并刷新多项基准测试记录。Meta还推出SA-3DAO数据集用于评估物理世界三维重建能力。项目已开源，相关论文和代码可在Meta官网及GitHub获取。

原文链接

智能视野

11-20 16:32:05

3D重建

图像分割

语义理解

分享至

打开微信扫一扫

内容投诉

生成图片

谢赛宁盛赞字节Seed新研究！单Transformer搞定任意视图3D重建

谢赛宁盛赞字节Seed新研究！单Transformer搞定任意视图3D重建闻乐发自凹非寺量子位 | 公众号 QbitAI 字节跳动Seed团队推出全新研究成果——Depth Anything 3（简称DA3），仅用一个Transformer模型即可实现从单张图片、多视角照片甚至视频中完成...

原文链接

电子诗篇

11-18 13:17:53

3D重建

Depth Anything 3

Transformer

分享至

打开微信扫一扫

内容投诉

生成图片

腾讯混元世界模型 1.1 版本发布并开源：单卡即可部署，秒级创造 3D 世界

10月22日，腾讯混元发布并开源混元世界模型1.1版本（WorldMirror）。新版本支持多视图及视频输入，单卡即可部署，可秒级生成3D世界。相比7月发布的1.0版本，1.1版突破了仅支持文本或单图输入的局限，首次实现多模态先验注入与多任务统一输出，支持点云、深度、相机等多种3D几何预测。模型已完全开源，开发者可通过GitHub一键部署，普通用户也可在HuggingFace Space在线体验实时3D渲染功能。相关资源已在官网及技术报告中提供。

原文链接

电子诗篇

10-22 18:50:23

3D重建

开源

腾讯混元世界模型

分享至

打开微信扫一扫

内容投诉

生成图片

3 张照片 → 全景 3D：苹果携手推出革命性 AI 模型 Matrix3D，简化 3D 重建过程

5月13日，苹果机器学习团队联合南京大学和香港科技大学推出Matrix3D，一款专注于从少量2D照片生成高质量3D重建的AI模型。传统摄影测量需多个独立模型处理姿态估计和深度预测，而Matrix3D通过整合图像、相机参数及深度数据，采用统一架构简化流程，大幅降低错误率并提高效率。其训练采用掩码学习法，类似ChatGPT早期版本，使模型在数据不足时仍能高效学习。测试显示，仅用3张输入图片即可生成详细3D重建，适用于Apple Vision Pro等头显设备，为元宇宙和AR发展带来新可能。

原文链接

梦境编程师

05-14 09:08:04

3D重建

AI模型

苹果

分享至

打开微信扫一扫

内容投诉

生成图片

扩散模型还原被遮挡物体，几张稀疏照片也能”脑补”完整重建交互式3D场景｜CVPR’25

标题：扩散模型还原被遮挡物体，几张稀疏照片也能“脑补”完整重建交互式3D场景｜CVPR’25 北京通用人工智能研究院联合清华大学、北京大学的研究团队提出DP-Recon方法，利用生成式扩散模型解决稀疏视角下3D场景重建难题。传统方法难以还原被遮挡区域，而DP-Recon通过组合式重建策略和可见性...

原文链接