标题:SkyReels-V2开源:突破视频生成技术边界,开启无限时长电影生成新时代
4月21日,昆仑万维SkyReels团队发布并开源SkyReels-V2,这是全球首个使用扩散强迫框架的无限时长电影生成模型。SkyReels-V2结合多模态大语言模型、多阶段预训练、强化学习及扩散强迫框架实现协同优化。
过去一年,视频生成技术虽在扩散模型和自回归框架推动下取得进展,但在提示词遵循、视觉质量、运动动态和时长协调上仍有挑战。现有技术常因提升视觉质量而牺牲运动效果,为追求高分辨率限制视频时长,且通用多模态大语言模型难以解读电影语法,导致生成能力不足。
SkyReels-V2通过多项技术创新解决这些问题。它具备影视级视频理解模型SkyCaptioner-V1,能高效理解视频数据并生成多样化描述,显著提升生成视频的提示词遵循能力。此外,通过强化学习优化运动质量,并采用扩散强迫框架实现长视频高效生成。
SkyReels-V2已支持生成30秒、40秒视频,具备高运动质量、高一致性和高保真视频生成能力。其性能在SkyReels-Bench和V-Bench评估中表现卓越,在指令遵循、运动质量、一致性和视觉质量等方面均领先于其他模型。
SkyReels-V2还支持多种应用场景,包括故事生成、图像到视频合成、摄像导演功能和元素到视频生成。团队将继续推动技术发展,开源SkyCaptioner-V1和SkyReels-V2系列模型,促进学术界和工业界的进一步研究和应用。
原文链接
本文链接:https://kx.umi6.com/article/17504.html
转载请注明文章出处
相关推荐
.png)
换一换
快手可灵 AI 上线 2.1 系列模型:不到 1 分钟生成 5 秒 1080p 视频,更快更便宜
2025-05-29 17:37:51
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
MiniMax 发布视频生成工具 Hailuo 02,打破全球视频模型效果成本纪录
2025-06-19 09:45:37
32B 稠密模型推理能力超越 R1?秘密 AI 团队发布推理小模型 AM-Thinking-v1
2025-05-16 14:53:48
不玩噱头的北京,用数据和实力成就「全球开源之都」
2025-05-20 20:44:53
UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了
2025-05-20 18:43:16
英伟达开源 9B 参数 AI 小模型 Nemotron Nano v2,比 Qwen3 快 6 倍
2025-08-19 15:01:14
小扎自曝挖人秘诀:小团队我亲自带,豪掷数百亿建GW集群,大家不图天价薪酬只为“造神”
2025-07-15 13:42:34
鹅厂开源视频生成大杀器!参考图主体精准复刻,还能编辑现有视频
2025-05-09 21:57:02
三家混战,大模型重回2023
2025-08-03 11:35:50
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
2025-07-11 23:44:58
DeepSeek-Prover-V2-671B 新模型开源发布
2025-04-30 19:50:58
京东云开源JoyAgent智能体
2025-07-26 10:36:52
508 文章
148105 浏览
24小时热文
更多

-
2025-08-27 11:04:59
-
2025-08-27 11:03:51
-
2025-08-27 11:02:44