1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:让视频生成从「看起来真实」到「物理上正确」

正文:
当前视频生成技术常因缺乏物理规律理解而显得不真实。例如,蜂蜜倒入茶中可能突然断裂,冰块融化直接消失,玻璃球入水瞬间静止。这些问题源于模型依赖数据驱动的模式匹配,而非模拟真实过程。

四川大学雷印杰团队提出了一种新方法《Chain of Event-Centric Causal Thought for Physically Plausible Video Generation》,通过将复杂现象拆分为因果事件链,并结合物理规律约束,逐步生成视频内容。这种方法不仅追求画面真实,更注重变化过程符合现实逻辑,从而提升可信度和一致性。

实验显示,该方法在 PhyGenBench 数据集上取得 0.66 的得分,较此前最优方法提升 8.19%,相对基础模型提升超 30%。尤其在力学、光学、热学等场景中表现突出,物理顺序正确性显著增强。在 VideoPhy 数据集上,其语义与物理一致性达 49.3%,较最优方法提升 3.4%,流体相关场景提升超 10%。

消融实验表明,事件分解和关键帧生成模块对性能至关重要,去掉它们分别导致 11% 和 17% 的性能下降。此外,事件数量在 4 时达到最佳效果,过多或过少均影响性能。

研究流程包括文本理解、物理规律识别、事件链构建、关键帧生成及插值过渡。通过引入物理公式、因果结构建模和视觉锚点,模型从“生成合理结果”迈向“模拟真实过程”。

这一技术可广泛应用于短视频创作、教育演示、游戏开发及自动驾驶等领域,使生成内容更真实连贯。尽管在复杂多物理场景下仍有局限,但为未来研究指明方向。

通讯作者雷印杰为四川大学教授,长期从事人工智能研究,聚焦计算机视觉与多模态理解,主持多项国家级项目,推动学术与工程结合。

论文地址:https://arxiv.org/pdf/2603.09094

原文链接
本文链接:https://kx.umi6.com/article/34272.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
视频生成平台 Runway 举办年度 AI 电影节,6000 部参赛作品决出十强
2025-06-09 09:23:25
鹅厂开源视频生成大杀器!参考图主体精准复刻,还能编辑现有视频
2025-05-09 21:57:02
设计师看呆,印象派插画转视频,揭秘Luma隐藏玩法
2024-06-17 18:26:57
无需训练、即插即用,新算法大幅增强视频生成质量|NUS&上海AI Lab&UT Austin
2024-12-25 22:14:22
全球首个开源类Sora猛升级,16秒720p画质电影感拉满!代码权重全开源
2024-06-18 18:12:15
爱诗科技完成6000万美元B轮融资
2025-09-10 11:35:05
单GPU搞定高清长视频生成,效率×10!引入Mamba机制突破DiT瓶颈 | 普林斯顿&Meta
2025-06-18 16:39:37
刚刚,全球视频模型新王诞生了!
2026-03-19 16:05:16
阿里开源通义新模型:指定首尾图片生成视频
2025-04-18 12:13:31
AI视频这条赛道,快手的可灵只是暂时领先
2024-07-26 18:15:42
潞晨尤洋:视频生成的GPT-4时刻,3年后可以见证 | MEET 2025
2025-01-03 15:44:15
AI恐怖体操视频腿脚乱飞、大变活人,LeCun:视频生成模型根本不懂物理
2024-07-01 18:07:59
OpenAI 拟将视频生成工具 Sora 整合进 ChatGPT,并推出更强大 Sora Turbo
2025-03-01 10:50:58
24小时热文
更多
扫一扫体验小程序