11B模型拿开源视频生成SOTA！仅用224张GPU训练，训练成本省10倍

2025-03-13 13:15:44

蝶舞CyberSwirl

发布在

科普

阅读：567

11B参数模型开源视频生成再创SOTA！训练成本降低10倍。

224张GPU训练，Open-Sora 2.0发布。模型参数达11B，性能媲美30B规模的闭源模型，但成本仅为20万美元。

支持720P、24FPS高画质，生成动作流畅自然。画面细节丰富，场景切换无缝衔接，超越多项开源与商业模型。

创新采用3D自编码器、Flow Matching框架及MMDiT架构，通过多桶训练和3D全注意力机制提升生成质量。同时，开源全流程训练代码，打造强大开源生态。

高压缩比自编码器将推理速度提升10倍，大幅降低生成成本。欢迎访问GitHub仓库，加入社区共同推进AI视频技术发展。

原文链接

本文链接：https://kx.umi6.com/article/15381.html

转载请注明文章出处

低成本

开源

视频生成

分享至

打开微信扫一扫

内容投诉

生成图片

713 文章

618771 浏览

24小时热文