阿里开源的视频生成模型Wan 2.1上线即表现亮眼,参数量为14B,直接在VBench上超越了Sora和Gen-3。模型能精准捕捉复杂运动细节,如5人同步跳hip-hop,还能在视频中生成自然的文字。
Wan 2.1有14B和1.3B两个版本,分别支持720P和480P分辨率。14B版本在4090显卡上占用8GB显存,耗时4分21秒。而1.3B版本在4070显卡上也可运行,适合个人创作者。
该模型免费商用,且支持通过多种平台访问,包括通义万相平台、HuggingFace和魔搭社区。Wan 2.1还支持图像生成视频功能,可生成日漫风格动画。其核心技术包括3D变分自动编码器和DiT架构,提升了视频生成速度和质量。
原文链接
本文链接:https://kx.umi6.com/article/14379.html
转载请注明文章出处
相关推荐
.png)
换一换
火山引擎发布豆包视频生成模型 Seedance 1.0 lite:影视级质量、速度大幅提升
2025-05-13 15:54:53
在海外,Sora 正在被可灵替代
2024-08-02 18:56:42
AI 视频生成王者 Sora 上线:OpenAI 的“魔法棒”,1080P@20 秒具象化你的想象力
2024-12-10 07:44:58
438 文章
65396 浏览
24小时热文
更多

-
2025-07-20 20:08:46
-
2025-07-20 20:07:36
-
2025-07-20 19:08:20