综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年6月,京东正式开源长音视频生成框架JoyAI-Echo,成功杀入全球长视频生成领域“第一梯队”。针对AI长视频角色变脸、声音漂移、生成慢等痛点,该框架创新引入跨模态音视频记忆库,确保5分钟内多镜头切换下角色与音色高度一致。同时,通过记忆驱动后训练将推理速度提升7.5倍,结合轻量化实时超分实现高清流畅输出。此外,框架配备Director Agent,支持自然语言对话式编辑与局部重拍。评测显示其多项指标全面领先,此次开源标志着AI长视频正从技术展示迈向规模化生产工具。
原文链接
标题:西湖大学张驰团队:无需重训,让视频生成更长更稳丨CVPR 2026
正文:
AI 视频生成技术近年来发展迅速,但一个核心问题始终未被彻底解决:如何在延长视频时长的同时保持画面的稳定性和一致性?西湖大学张驰团队提出了一种名为《Free-Lunch Long Video Generation ...
原文链接
正文:2025年10月6日,字节跳动与UCLA联合发布了一项名为Self-Forcing++的AI技术,成功突破分钟级长视频生成瓶颈,最长可生成4分15秒高质量视频,较现有5-10秒生成能力提升近50倍。该方法无需更换模型架构或重新收集数据集,通过反向噪声初始化、扩展分布匹配蒸馏和滚动KV缓存训练等创新优化,显著抑制了长视频后期画质下降问题。实验显示,Self-Forcing++在语义一致性、视觉稳定性和动态表现上全面领先CausVid、SkyReels等基准模型,且支持开源。研究人员还引入Gemini-2.5-Pro作为评估工具,进一步提升了评价准确性。这一技术或将推动AI电影时代的到来。
原文链接
正文:复旦大学与百度联合研发的AI模型Halio2于10月21日开源发布。该模型能生成长达一小时、分辨率为4K的人物动画视频,显著提升了长视频生成的质量与稳定性。Halio2基于latent diffusion models,并采用patch-drop和高斯噪声的数据增强技术,增强了长时间视频的视觉一致性和时间连贯性。同时,Halio2融合了向量量化生成对抗网络和时间对齐技术,确保了高分辨率视频的质量和流畅度。此外,Halio2还支持通过文本标签来调整肖像表情,增加了生成内容的多样性和可控性。这是首款能够生成如此高质量、长时长视频的AI模型,标志着AI技术在视频生成领域的重大突破。项目地址:
原文链接
加载更多
暂无内容