11B参数模型开源视频生成再创SOTA!训练成本降低10倍。
224张GPU训练,Open-Sora 2.0发布。模型参数达11B,性能媲美30B规模的闭源模型,但成本仅为20万美元。
支持720P、24FPS高画质,生成动作流畅自然。画面细节丰富,场景切换无缝衔接,超越多项开源与商业模型。
创新采用3D自编码器、Flow Matching框架及MMDiT架构,通过多桶训练和3D全注意力机制提升生成质量。同时,开源全流程训练代码,打造强大开源生态。
高压缩比自编码器将推理速度提升10倍,大幅降低生成成本。欢迎访问GitHub仓库,加入社区共同推进AI视频技术发展。
原文链接
本文链接:https://kx.umi6.com/article/15381.html
转载请注明文章出处
相关推荐
换一换
力压Seedance 2.0! 神秘AI模型登全球AI评测榜第一名:正式宣布开源
2026-04-09 12:05:02
真如摄影、细至发丝!阿里开源新一代图像生成模型Qwen-Image
2025-12-31 21:40:29
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
华为昇腾 0Day 支持 DeepSeek-V3.2-Exp,面向开发者开源所有推理代码和算子实现
2025-09-29 20:14:51
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
黄仁勋率先开源量子AI大模型
2026-04-15 12:57:46
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
X 平台正式开源推荐算法,马斯克称没有其他社交媒体公司这样做
2026-01-20 14:10:44
即梦AI网页版全面升级 打造一站式“AI片场”助力创意实现
2025-12-17 21:04:52
腾讯宣布企业微信正式开源CLI AI可调用日程、文档等7大能力
2026-03-30 10:41:47
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
智谱上线并开源文本转语音模型 GLM-TTS:只需 3 秒语音样本即可克隆声音
2025-12-11 10:42:18
713 文章
618771 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41