标题:SkyReels-V2开源:突破视频生成技术边界,开启无限时长电影生成新时代
4月21日,昆仑万维SkyReels团队发布并开源SkyReels-V2,这是全球首个使用扩散强迫框架的无限时长电影生成模型。SkyReels-V2结合多模态大语言模型、多阶段预训练、强化学习及扩散强迫框架实现协同优化。
过去一年,视频生成技术虽在扩散模型和自回归框架推动下取得进展,但在提示词遵循、视觉质量、运动动态和时长协调上仍有挑战。现有技术常因提升视觉质量而牺牲运动效果,为追求高分辨率限制视频时长,且通用多模态大语言模型难以解读电影语法,导致生成能力不足。
SkyReels-V2通过多项技术创新解决这些问题。它具备影视级视频理解模型SkyCaptioner-V1,能高效理解视频数据并生成多样化描述,显著提升生成视频的提示词遵循能力。此外,通过强化学习优化运动质量,并采用扩散强迫框架实现长视频高效生成。
SkyReels-V2已支持生成30秒、40秒视频,具备高运动质量、高一致性和高保真视频生成能力。其性能在SkyReels-Bench和V-Bench评估中表现卓越,在指令遵循、运动质量、一致性和视觉质量等方面均领先于其他模型。
SkyReels-V2还支持多种应用场景,包括故事生成、图像到视频合成、摄像导演功能和元素到视频生成。团队将继续推动技术发展,开源SkyCaptioner-V1和SkyReels-V2系列模型,促进学术界和工业界的进一步研究和应用。
原文链接
本文链接:https://kx.umi6.com/article/17504.html
转载请注明文章出处
相关推荐
换一换
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
单GPU搞定高清长视频生成,效率×10!引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta
2025-06-18 16:39:37
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
腾讯发布混元3D世界模型1.0:首个支持物理仿真的开源世界生成系统
2025-08-01 09:00:10
MoE那么大,几段代码就能稳稳推理 | 开源
2025-07-02 18:09:04
小扎改口不开源,Meta股价暴涨12%
2025-08-01 08:56:20
谷歌太壕了!编程Agent大招至简:开源且免费,百万上下文、多模态、MCP全支持
2025-06-26 10:56:45
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
2025-06-17 17:28:14
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
快手可灵 2.5 Turbo 模型上线,较上代模型便宜近 30%
2025-09-23 20:22:21
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
2025-07-30 12:43:45
AMD甩出最猛两代AI芯片,算力飙涨、豪气堆料
2025-06-13 12:08:30
555 文章
295312 浏览
24小时热文
更多
-
2025-10-24 22:57:14 -
2025-10-24 21:54:02 -
2025-10-24 21:53:50