标题:单GPU高效生成高清长视频,LinGen突破DiT瓶颈 | 普林斯顿&Meta
视频生成模型昂贵且运行缓慢?普林斯顿大学与Meta合作推出的LinGen框架通过引入MATE模块,将计算复杂度从像素数平方降至线性,使单张GPU即可在分钟级别生成高质量视频,效率提升十倍。实验显示,LinGen在视频质量上优于DiT,最高减少15倍FLOPs和延迟,与顶级模型媲美。
LinGen保留DiT架构,仅替换其核心自注意力模块为MATE。MATE由MA和TE两部分组成,MA采用Mamba2模块并结合Rotary Major Scan(RMS),实现高效硬件适配。TE则利用TESA模块聚焦临近信息,确保线性复杂度。此外,LinGen引入review tokens增强长程一致性。
评估显示,LinGen在FLOPs和延迟上均大幅超越DiT,推理速度提升超11倍。与DiT相比,LinGen更易适应长序列任务,尤其在预训练初期表现优异。项目主页:https://lineargen.github.io/;论文链接:https://arxiv.org/abs/2412.09856;代码仓库:https://github.com/jha-lab/LinGen。
原文链接
本文链接:https://kx.umi6.com/article/20390.html
转载请注明文章出处
相关推荐
换一换
微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora
2024-12-26 12:32:40
OpenAI给不了的,DeepMind给,Sora联合负责人跳槽后开组新团队
2025-01-07 13:03:56
预定最强视频生成 AI 模型,OpenAI Sora 2 现踪迹
2025-07-24 11:05:38
字节跳动 AI 助手豆包上线图片理解功能,上传图片即可“读图”
2024-12-04 08:33:01
淘宝“图生视频”“脚本成片”等多种AI工具上线!商家制作视频从未如此简单
2025-05-16 14:47:08
中国AI融资总额27762亿元,启明创投周志峰预测:3年内视频生成将全面爆发
2024-07-09 00:29:02
AI视频新霸主诞生,Dream Machine官宣免费用,电影级大片全网玩疯
2024-06-13 18:09:19
快手可灵 AI 上线 2.1 系列模型:不到 1 分钟生成 5 秒 1080p 视频,更快更便宜
2025-05-29 17:37:51
首月最低价19元 快手可灵AI全球会员体系正式上线:支持AI视频生成
2024-08-23 17:35:08
Sora 二代实机演示曝光:解锁图生视频,阿尔特曼暗示“期待周二”
2024-12-09 15:35:15
AI版《黑客帝国》:无限生成逼真视频,3A画质,还能实时交互
2024-11-21 12:30:33
第一批不找工作的年轻人,靠AI半年赚30万
2024-10-16 10:22:27
免训练加速DiT!Meta提出自适应缓存新方法,视频生成快2.6倍
2024-11-08 09:15:04
569 文章
325877 浏览
24小时热文
更多
-
2025-12-08 20:48:29 -
2025-12-08 20:47:34 -
2025-12-08 20:45:30