标题:SkyReels-V2开源:突破视频生成技术边界,开启无限时长电影生成新时代
4月21日,昆仑万维SkyReels团队发布并开源SkyReels-V2,这是全球首个使用扩散强迫框架的无限时长电影生成模型。SkyReels-V2结合多模态大语言模型、多阶段预训练、强化学习及扩散强迫框架实现协同优化。
过去一年,视频生成技术虽在扩散模型和自回归框架推动下取得进展,但在提示词遵循、视觉质量、运动动态和时长协调上仍有挑战。现有技术常因提升视觉质量而牺牲运动效果,为追求高分辨率限制视频时长,且通用多模态大语言模型难以解读电影语法,导致生成能力不足。
SkyReels-V2通过多项技术创新解决这些问题。它具备影视级视频理解模型SkyCaptioner-V1,能高效理解视频数据并生成多样化描述,显著提升生成视频的提示词遵循能力。此外,通过强化学习优化运动质量,并采用扩散强迫框架实现长视频高效生成。
SkyReels-V2已支持生成30秒、40秒视频,具备高运动质量、高一致性和高保真视频生成能力。其性能在SkyReels-Bench和V-Bench评估中表现卓越,在指令遵循、运动质量、一致性和视觉质量等方面均领先于其他模型。
SkyReels-V2还支持多种应用场景,包括故事生成、图像到视频合成、摄像导演功能和元素到视频生成。团队将继续推动技术发展,开源SkyCaptioner-V1和SkyReels-V2系列模型,促进学术界和工业界的进一步研究和应用。
原文链接
本文链接:https://kx.umi6.com/article/17504.html
转载请注明文章出处
相关推荐
换一换
蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0
2025-12-12 15:57:42
马斯克背叛理想
2025-08-24 22:18:31
上传一张图、主演任何视频,“性能最强动作生成模型”阿里通义万相 Wan2.2-Animate 开源
2025-09-19 15:14:57
Databricks 呼吁美国 AI 行业拥抱开源:这是中国能够领先的关键因素
2025-11-15 15:55:27
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
商汤开源空间智能大模型SenseNova-SI
2025-11-11 08:59:30
北京人形机器人创新中心开源Pelican-VL 1.0模型
2025-11-13 21:24:03
连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹
2025-10-11 16:31:47
AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍
2025-11-05 18:16:46
消息称 Meta 正讨论放弃开源 AI 模型 Behemoth,转向闭源战略
2025-07-15 15:46:36
开源Agent模型榜第一名,现在是阿里通义DeepResearch
2025-09-18 15:54:31
蚂蚁发布并开源万亿参数思考模型Ring-1T
2025-10-14 17:25:02
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
608 文章
396797 浏览
24小时热文
更多
-
2025-12-18 22:08:34 -
2025-12-18 21:06:21 -
2025-12-18 20:08:05