1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:西湖大学张驰团队:无需重训,让视频生成更长更稳丨CVPR 2026

正文:
AI 视频生成技术近年来发展迅速,但一个核心问题始终未被彻底解决:如何在延长视频时长的同时保持画面的稳定性和一致性?西湖大学张驰团队提出了一种名为《Free-Lunch Long Video Generation via Layer-Adaptive O.O.D Correction》的新方法(简称 FreeLOC),为这一难题提供了突破性解决方案。

研究指出,AI 视频生成的主要挑战在于“位置 O.O.D”和“上下文 O.O.D”两类问题。当视频长度增加时,模型容易出现人物漂移、背景混乱和动作失真等问题。FreeLOC 的创新之处在于,它通过分层处理策略,针对不同层的问题进行针对性修正,从而显著提升了长视频生成的质量。

实验结果显示,FreeLOC 在 Wan2.1-T2V-1.3B 和 HunyuanVideo 等模型上均表现出色。例如,在 4 倍长度(321 帧)的生成任务中,FreeLOC 的主体一致性达到 98.44,图像质量为 67.44,美学质量为 61.21,动态程度为 36.27,远超其他方法。更重要的是,随着视频长度增加,FreeLOC 的优势愈发明显,证明其在高难度场景下的稳定性。

研究团队还通过消融实验验证了 FreeLOC 的核心机制。他们发现,单独使用 TSA(时间注意力控制)或 VRPR(多粒度位置重编码)虽能提升效果,但只有将两者结合并按层适配,才能实现最佳性能。此外,逐层分析 Transformer 的实验进一步揭示了不同层对问题的敏感性差异,为分层处理策略提供了理论支持。

这项研究的意义不仅在于技术指标的提升,更在于降低了长视频生成的技术门槛。与传统方法需要重新训练模型不同,FreeLOC 仅在推理阶段进行优化,大幅减少了算力成本,使现有模型更容易直接应用。这为内容创作者制作更长、更连贯的视频提供了便利,推动 AI 视频生成从“能生成”向“能使用”迈进了一大步。

论文一作田佳豪是西湖大学 AGI Lab 的科研助理,主要研究方向包括扩散生成模型和视频生成。通讯作者张驰教授是生成式人工智能领域的专家,长期深耕多模态生成建模和智能体系统,曾发表多项顶级会议成果。

参考链接:https://icoz69.github.io/

原文链接
本文链接:https://kx.umi6.com/article/35069.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
西湖大学教授:AI是可控的!鼓励使用AI探索人机协同合作
2025-10-27 16:09:57
AI文本生成识别新突破!西湖大学推出Fast-DetectGPT
2024-06-28 22:40:21
5分钟AI长视频不翻车!国产开源框架杀到全球第一梯队
2026-06-07 09:22:47
首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造 AI 开源模型 Hallo2
2024-10-21 10:24:56
Sora2还在5秒打转,字节AI生视频已经4分钟“起飞”
2025-10-06 14:37:37
西湖大学发布 “AI 科学家” Nova,效果相比SOTA提升2.5倍
2024-10-23 16:43:46
海亮股份与西湖大学成立先进金属材料与制造联合实验室
2025-11-17 10:22:36
首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%
2025-10-09 09:06:05
顶尖AI专家齐国君自美归国:加盟西湖大学 拿过华为总裁奖
2025-03-25 17:08:06
AI水论文还得AI治:西湖大学首次模拟人类专家思考链,AI审稿分钟级给出全面反馈
2025-09-13 14:26:19
世界模型榜首易主!跨维智能登顶WorldArena
2026-06-03 19:33:11
太讽刺了 号称最注重AI安全的Anthropic曝出用户隐私泄露问题
2026-06-07 14:42:06
LG砸重金采购万片英伟达GPU 全速冲刺AI转型
2026-06-07 23:56:41
24小时热文
更多
扫一扫体验小程序