长视频生成 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

5分钟AI长视频不翻车！国产开源框架杀到全球第一梯队

2026年6月，京东正式开源长音视频生成框架JoyAI-Echo，成功杀入全球长视频生成领域“第一梯队”。针对AI长视频角色变脸、声音漂移、生成慢等痛点，该框架创新引入跨模态音视频记忆库，确保5分钟内多镜头切换下角色与音色高度一致。同时，通过记忆驱动后训练将推理速度提升7.5倍，结合轻量化实时超分实现高清流畅输出。此外，框架配备Director Agent，支持自然语言对话式编辑与局部重拍。评测显示其多项指标全面领先，此次开源标志着AI长视频正从技术展示迈向规模化生产工具。

原文链接

Oasis

06-07 09:22:47

分享至

打开微信扫一扫

内容投诉

生成图片

西湖大学张驰团队：不重训，也能让视频生成更长更稳丨CVPR 2026

标题：西湖大学张驰团队：无需重训，让视频生成更长更稳丨CVPR 2026 正文： AI 视频生成技术近年来发展迅速，但一个核心问题始终未被彻底解决：如何在延长视频时长的同时保持画面的稳定性和一致性？西湖大学张驰团队提出了一种名为《Free-Lunch Long Video Generation ...

原文链接

蝶舞CyberSwirl

04-22 15:17:17

分享至

打开微信扫一扫

内容投诉

生成图片

Sora2还在5秒打转，字节AI生视频已经4分钟“起飞”

正文：2025年10月6日，字节跳动与UCLA联合发布了一项名为Self-Forcing++的AI技术，成功突破分钟级长视频生成瓶颈，最长可生成4分15秒高质量视频，较现有5-10秒生成能力提升近50倍。该方法无需更换模型架构或重新收集数据集，通过反向噪声初始化、扩展分布匹配蒸馏和滚动KV缓存训练等创新优化，显著抑制了长视频后期画质下降问题。实验显示，Self-Forcing++在语义一致性、视觉稳定性和动态表现上全面领先CausVid、SkyReels等基准模型，且支持开源。研究人员还引入Gemini-2.5-Pro作为评估工具，进一步提升了评价准确性。这一技术或将推动AI电影时代的到来。

原文链接

数据炼金师

10-06 14:37:37

分享至

打开微信扫一扫

内容投诉

生成图片

首发根据音频生成 4K 分辨率 1 小时长视频，复旦、百度联手打造 AI 开源模型 Hallo2

正文：复旦大学与百度联合研发的AI模型Halio2于10月21日开源发布。该模型能生成长达一小时、分辨率为4K的人物动画视频，显著提升了长视频生成的质量与稳定性。Halio2基于latent diffusion models，并采用patch-drop和高斯噪声的数据增强技术，增强了长时间视频的视觉一致性和时间连贯性。同时，Halio2融合了向量量化生成对抗网络和时间对齐技术，确保了高分辨率视频的质量和流畅度。此外，Halio2还支持通过文本标签来调整肖像表情，增加了生成内容的多样性和可控性。这是首款能够生成如此高质量、长时长视频的AI模型，标志着AI技术在视频生成领域的重大突破。项目地址：

原文链接