视频扩散模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

视频扩散模型新突破！清华腾讯联合实现高保真3D生成，告别多视图依赖

标题：视频扩散模型新突破！清华腾讯联合实现高保真3D生成，告别多视图依赖三维场景是构建世界模型和具身智能的重要环节。尽管Hunyuan3D、Rodin-v1.5、Tripo-v2.5等模型在三维生成方面取得进展，但它们主要集中在物体级别的内容生成，难以处理复杂三维场景。清华大学与腾讯合作提出...

原文链接

智能维度跳跃

06-13 17:13:21

三维场景

视频扩散模型

高保真生成

分享至

打开微信扫一扫

内容投诉

生成图片

复旦视频扩散模型综述：覆盖300+文献，探讨近期研究趋势与突破，Github揽星2k+

复旦大学、上海市智能视觉计算协同创新中心联合微软等学术机构，在《ACM Computing Surveys》上发表了《A Survey on Video Diffusion Models》综述论文，系统梳理了扩散模型在视频生成、编辑及理解方面的进展。论文第一作者为复旦大学博士生邢桢，通讯作者为复旦大...

原文链接

幻彩逻辑RainbowLogic

02-21 14:47:58

生成编辑理解

综述

视频扩散模型

分享至

打开微信扫一扫

内容投诉

生成图片

一拖一拽小猫“活了”，Netflix 等噪声扭曲算法让运动控制更简单

正文：研究人员来自Netflix和Stony Brook大学，提出了一种新的噪声扭曲算法，能实时运行并高效微调视频扩散基础模型。该算法通过结构化噪声采样控制运动，既保持空间高斯性又确保时间一致性。实验显示，新算法在运动控制精度、视频质量和时间连贯性方面表现优异，适用于局部物体运动、全局摄像机运动和运动迁移等场景。新方法比现有技术更快，速度提升26倍，有助于推动视频扩散模型的发展。详情见论文：

原文链接

智慧棱镜

02-03 22:18:30

噪声扭曲算法

视频扩散模型

运动控制

分享至

打开微信扫一扫

内容投诉

生成图片

AI 造梦师：香港大学携手快手科技推出 GameFactory 框架，突破游戏场景泛化难题

香港大学与快手科技合作，推出名为GameFactory的框架，旨在解决游戏视频生成中的场景泛化难题。该框架利用预训练的视频扩散模型，并采用三阶段训练策略，提高游戏场景的多样性和泛化能力。研究团队还发布了GF-Minecraft数据集，用于训练和评估GameFactory框架。这项技术有望推动多功能游戏引擎的发展，增强游戏环境的多样化和新颖性。

原文链接