
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:视频扩散模型新突破!清华腾讯联合实现高保真3D生成,告别多视图依赖
三维场景是构建世界模型和具身智能的重要环节。尽管Hunyuan3D、Rodin-v1.5、Tripo-v2.5等模型在三维生成方面取得进展,但它们主要集中在物体级别的内容生成,难以处理复杂三维场景。
清华大学与腾讯合作提出...
原文链接
复旦大学、上海市智能视觉计算协同创新中心联合微软等学术机构,在《ACM Computing Surveys》上发表了《A Survey on Video Diffusion Models》综述论文,系统梳理了扩散模型在视频生成、编辑及理解方面的进展。论文第一作者为复旦大学博士生邢桢,通讯作者为复旦大...
原文链接
正文:研究人员来自Netflix和Stony Brook大学,提出了一种新的噪声扭曲算法,能实时运行并高效微调视频扩散基础模型。该算法通过结构化噪声采样控制运动,既保持空间高斯性又确保时间一致性。实验显示,新算法在运动控制精度、视频质量和时间连贯性方面表现优异,适用于局部物体运动、全局摄像机运动和运动迁移等场景。新方法比现有技术更快,速度提升26倍,有助于推动视频扩散模型的发展。详情见论文:
原文链接
香港大学与快手科技合作,推出名为GameFactory的框架,旨在解决游戏视频生成中的场景泛化难题。该框架利用预训练的视频扩散模型,并采用三阶段训练策略,提高游戏场景的多样性和泛化能力。研究团队还发布了GF-Minecraft数据集,用于训练和评估GameFactory框架。这项技术有望推动多功能游戏引擎的发展,增强游戏环境的多样化和新颖性。
原文链接
加载更多

暂无内容