
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
10月22日,腾讯混元发布并开源混元世界模型1.1版本(WorldMirror)。新版本支持多视图及视频输入,单卡即可部署,可秒级生成3D世界。相比7月发布的1.0版本,1.1版突破了仅支持文本或单图输入的局限,首次实现多模态先验注入与多任务统一输出,支持点云、深度、相机等多种3D几何预测。模型已完全开源,开发者可通过GitHub一键部署,普通用户也可在HuggingFace Space在线体验实时3D渲染功能。相关资源已在官网及技术报告中提供。
原文链接
5月13日,苹果机器学习团队联合南京大学和香港科技大学推出Matrix3D,一款专注于从少量2D照片生成高质量3D重建的AI模型。传统摄影测量需多个独立模型处理姿态估计和深度预测,而Matrix3D通过整合图像、相机参数及深度数据,采用统一架构简化流程,大幅降低错误率并提高效率。其训练采用掩码学习法,类似ChatGPT早期版本,使模型在数据不足时仍能高效学习。测试显示,仅用3张输入图片即可生成详细3D重建,适用于Apple Vision Pro等头显设备,为元宇宙和AR发展带来新可能。
原文链接
标题:扩散模型还原被遮挡物体,几张稀疏照片也能“脑补”完整重建交互式3D场景|CVPR’25
北京通用人工智能研究院联合清华大学、北京大学的研究团队提出DP-Recon方法,利用生成式扩散模型解决稀疏视角下3D场景重建难题。传统方法难以还原被遮挡区域,而DP-Recon通过组合式重建策略和可见性...
原文链接
加载更多

暂无内容