长视频生成 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

Sora2还在5秒打转，字节AI生视频已经4分钟“起飞”

正文：2025年10月6日，字节跳动与UCLA联合发布了一项名为Self-Forcing++的AI技术，成功突破分钟级长视频生成瓶颈，最长可生成4分15秒高质量视频，较现有5-10秒生成能力提升近50倍。该方法无需更换模型架构或重新收集数据集，通过反向噪声初始化、扩展分布匹配蒸馏和滚动KV缓存训练等创新优化，显著抑制了长视频后期画质下降问题。实验显示，Self-Forcing++在语义一致性、视觉稳定性和动态表现上全面领先CausVid、SkyReels等基准模型，且支持开源。研究人员还引入Gemini-2.5-Pro作为评估工具，进一步提升了评价准确性。这一技术或将推动AI电影时代的到来。

原文链接

数据炼金师

10-06 14:37:37

Self-Forcing++

字节AI

长视频生成

分享至

打开微信扫一扫

内容投诉

生成图片

百度蒸汽机发布通用AI长视频生成功能

9月25日，百度蒸汽机发布全球首个中文音视频一体化模型的通用AI长视频生成功能。该功能突破以往AI仅能生成短视频或依赖首尾帧续写的限制，支持用户生成无限长度的AI视频，并引入“流式无限生成”技术，首次实现通用长视频的‘无限’生成能力。这一升级为行业首创，带来更灵活的视频创作体验。

原文链接

超频思维站

09-25 19:12:15

AI长视频生成

流式无限生成

百度蒸汽机

分享至

打开微信扫一扫

内容投诉

生成图片

百度蒸汽机发布通用 AI 长视频生成功能，行业首次突破长度限制

9月25日，百度蒸汽机发布通用AI长视频生成功能，首次突破行业长度限制，支持生成无限长度的AI视频。此次升级通过流式生成技术，解决了以往仅能生成5秒、10秒短视频或依赖首尾帧续写的局限。此前，百度蒸汽机音视频一体化模型在上个月完成2.0版本升级，实现多人有声视频一体化生成，并具备复杂运镜、电影级细腻表演和流畅画质等特性。新功能进一步巩固了其在音视频生成领域的领先地位，为用户提供更强大、灵活的创作工具。

原文链接

虚拟微光

09-25 18:07:23

AI长视频生成

百度蒸汽机

音视频一体化模型

分享至

打开微信扫一扫

内容投诉

生成图片

首发根据音频生成 4K 分辨率 1 小时长视频，复旦、百度联手打造 AI 开源模型 Hallo2

正文：复旦大学与百度联合研发的AI模型Halio2于10月21日开源发布。该模型能生成长达一小时、分辨率为4K的人物动画视频，显著提升了长视频生成的质量与稳定性。Halio2基于latent diffusion models，并采用patch-drop和高斯噪声的数据增强技术，增强了长时间视频的视觉一致性和时间连贯性。同时，Halio2融合了向量量化生成对抗网络和时间对齐技术，确保了高分辨率视频的质量和流畅度。此外，Halio2还支持通过文本标签来调整肖像表情，增加了生成内容的多样性和可控性。这是首款能够生成如此高质量、长时长视频的AI模型，标志着AI技术在视频生成领域的重大突破。项目地址：

原文链接