标题:SkyReels-V2开源:突破视频生成技术边界,开启无限时长电影生成新时代
4月21日,昆仑万维SkyReels团队发布并开源SkyReels-V2,这是全球首个使用扩散强迫框架的无限时长电影生成模型。SkyReels-V2结合多模态大语言模型、多阶段预训练、强化学习及扩散强迫框架实现协同优化。
过去一年,视频生成技术虽在扩散模型和自回归框架推动下取得进展,但在提示词遵循、视觉质量、运动动态和时长协调上仍有挑战。现有技术常因提升视觉质量而牺牲运动效果,为追求高分辨率限制视频时长,且通用多模态大语言模型难以解读电影语法,导致生成能力不足。
SkyReels-V2通过多项技术创新解决这些问题。它具备影视级视频理解模型SkyCaptioner-V1,能高效理解视频数据并生成多样化描述,显著提升生成视频的提示词遵循能力。此外,通过强化学习优化运动质量,并采用扩散强迫框架实现长视频高效生成。
SkyReels-V2已支持生成30秒、40秒视频,具备高运动质量、高一致性和高保真视频生成能力。其性能在SkyReels-Bench和V-Bench评估中表现卓越,在指令遵循、运动质量、一致性和视觉质量等方面均领先于其他模型。
SkyReels-V2还支持多种应用场景,包括故事生成、图像到视频合成、摄像导演功能和元素到视频生成。团队将继续推动技术发展,开源SkyCaptioner-V1和SkyReels-V2系列模型,促进学术界和工业界的进一步研究和应用。
原文链接
本文链接:https://kx.umi6.com/article/17504.html
转载请注明文章出处
相关推荐
换一换
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
2025外滩大会:蚂蚁、人大发布首个原生MoE扩散语言模型,将于近期开源
2025-09-12 10:08:55
荣耀推出智能体基础模型MagicAgent 面向全球开源
2026-03-03 16:20:21
上传一张图、主演任何视频,“性能最强动作生成模型”阿里通义万相 Wan2.2-Animate 开源
2025-09-19 15:14:57
AI助手OpenClaw爆火:一个24小时不休息的数字管家
2026-02-01 00:05:18
真如摄影、细至发丝!阿里开源新一代图像生成模型Qwen-Image
2025-12-31 21:40:29
多人有声视频一体化生成!用百度最新AI生成营销视频,现在1.4元/5秒
2025-08-22 11:43:56
连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹
2025-10-11 16:31:47
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
阶跃星辰全面开源 Step 3.5 Flash:预训练+训练框架全放出 冲上 OpenClaw Top2
2026-03-04 10:34:06
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025-12-01 15:15:24
让 AI“说人话”:微软 Copilot 上线测试 Real Talk,真诚和你对话
2026-01-20 07:40:25
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
660 文章
483315 浏览
24小时热文
更多
-
2026-03-04 17:00:06 -
2026-03-04 16:58:59 -
2026-03-04 16:53:49