1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:单GPU高效生成高清长视频,LinGen突破DiT瓶颈 | 普林斯顿&Meta

视频生成模型昂贵且运行缓慢?普林斯顿大学与Meta合作推出的LinGen框架通过引入MATE模块,将计算复杂度从像素数平方降至线性,使单张GPU即可在分钟级别生成高质量视频,效率提升十倍。实验显示,LinGen在视频质量上优于DiT,最高减少15倍FLOPs和延迟,与顶级模型媲美。

LinGen保留DiT架构,仅替换其核心自注意力模块为MATE。MATE由MA和TE两部分组成,MA采用Mamba2模块并结合Rotary Major Scan(RMS),实现高效硬件适配。TE则利用TESA模块聚焦临近信息,确保线性复杂度。此外,LinGen引入review tokens增强长程一致性。

评估显示,LinGen在FLOPs和延迟上均大幅超越DiT,推理速度提升超11倍。与DiT相比,LinGen更易适应长序列任务,尤其在预训练初期表现优异。项目主页:https://lineargen.github.io/;论文链接:https://arxiv.org/abs/2412.09856;代码仓库:https://github.com/jha-lab/LinGen。

原文链接
本文链接:https://kx.umi6.com/article/20390.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
单卡2秒生成一个视频!清华联手生数开源TurboDiffusion,视频DeepSeek时刻来了
2025-12-25 20:58:27
阿里万相视频生成大模型宣布开源:8.2GB 显存就能跑,测试超越 Sora
2025-02-25 23:11:59
王炸!谁能想到年底杀出的黑马是美图啊
2024-11-22 16:03:28
全球首个开源类Sora猛升级,16秒720p画质电影感拉满!代码权重全开源
2024-06-18 18:12:15
无需训练、即插即用,新算法大幅增强视频生成质量|NUS&上海AI Lab&UT Austin
2024-12-25 22:14:22
阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码
2025-01-10 11:16:50
OpenAI Sora 2 更新上线:所有用户均能生成 15 秒视频,Pro 最长 25 秒
2025-10-16 15:54:40
豆包生视频功能升级 可同步生成声音和画面
2025-12-19 14:56:10
快手发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型
2025-04-15 15:33:39
全球首个无限时长视频生成!新扩散模型引爆万亿市场,电影级理解,全面开源
2025-04-21 16:45:29
SkyReels-V2开源:突破视频生成技术边界,开启无限时长电影生成新时代
2025-04-21 10:36:16
腾讯AI视频生成曝光!与Sora同提示词PK,效果如何?
2024-12-02 14:51:40
OpenAI 阿尔特曼在线征集“新年愿望”,网友期待新增家庭账户、优化语音聊天等
2024-12-26 09:27:03
24小时热文
更多
扫一扫体验小程序