
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:2025年10月6日,字节跳动与UCLA联合发布了一项名为Self-Forcing++的AI技术,成功突破分钟级长视频生成瓶颈,最长可生成4分15秒高质量视频,较现有5-10秒生成能力提升近50倍。该方法无需更换模型架构或重新收集数据集,通过反向噪声初始化、扩展分布匹配蒸馏和滚动KV缓存训练等创新优化,显著抑制了长视频后期画质下降问题。实验显示,Self-Forcing++在语义一致性、视觉稳定性和动态表现上全面领先CausVid、SkyReels等基准模型,且支持开源。研究人员还引入Gemini-2.5-Pro作为评估工具,进一步提升了评价准确性。这一技术或将推动AI电影时代的到来。
原文链接
9月25日,百度蒸汽机发布全球首个中文音视频一体化模型的通用AI长视频生成功能。该功能突破以往AI仅能生成短视频或依赖首尾帧续写的限制,支持用户生成无限长度的AI视频,并引入“流式无限生成”技术,首次实现通用长视频的‘无限’生成能力。这一升级为行业首创,带来更灵活的视频创作体验。
原文链接
9月25日,百度蒸汽机发布通用AI长视频生成功能,首次突破行业长度限制,支持生成无限长度的AI视频。此次升级通过流式生成技术,解决了以往仅能生成5秒、10秒短视频或依赖首尾帧续写的局限。此前,百度蒸汽机音视频一体化模型在上个月完成2.0版本升级,实现多人有声视频一体化生成,并具备复杂运镜、电影级细腻表演和流畅画质等特性。新功能进一步巩固了其在音视频生成领域的领先地位,为用户提供更强大、灵活的创作工具。
原文链接
正文:复旦大学与百度联合研发的AI模型Halio2于10月21日开源发布。该模型能生成长达一小时、分辨率为4K的人物动画视频,显著提升了长视频生成的质量与稳定性。Halio2基于latent diffusion models,并采用patch-drop和高斯噪声的数据增强技术,增强了长时间视频的视觉一致性和时间连贯性。同时,Halio2融合了向量量化生成对抗网络和时间对齐技术,确保了高分辨率视频的质量和流畅度。此外,Halio2还支持通过文本标签来调整肖像表情,增加了生成内容的多样性和可控性。这是首款能够生成如此高质量、长时长视频的AI模型,标志着AI技术在视频生成领域的重大突破。项目地址:
原文链接
加载更多

暂无内容