1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
5分钟AI长视频不翻车!国产开源框架杀到全球第一梯队
2026年6月,京东正式开源长音视频生成框架JoyAI-Echo,成功杀入全球长视频生成领域“第一梯队”。针对AI长视频角色变脸、声音漂移、生成慢等痛点,该框架创新引入跨模态音视频记忆库,确保5分钟内多镜头切换下角色与音色高度一致。同时,通过记忆驱动后训练将推理速度提升7.5倍,结合轻量化实时超分实现高清流畅输出。此外,框架配备Director Agent,支持自然语言对话式编辑与局部重拍。评测显示其多项指标全面领先,此次开源标志着AI长视频正从技术展示迈向规模化生产工具。
Oasis
06-07 09:22:47
分享至
打开微信扫一扫
内容投诉
生成图片
西湖大学张驰团队:不重训,也能让视频生成更长更稳丨CVPR 2026
标题:西湖大学张驰团队:无需重训,让视频生成更长更稳丨CVPR 2026 正文: AI 视频生成技术近年来发展迅速,但一个核心问题始终未被彻底解决:如何在延长视频时长的同时保持画面的稳定性和一致性?西湖大学张驰团队提出了一种名为《Free-Lunch Long Video Generation ...
蝶舞CyberSwirl
04-22 15:17:17
分享至
打开微信扫一扫
内容投诉
生成图片
Sora2还在5秒打转,字节AI生视频已经4分钟“起飞”
正文:2025年10月6日,字节跳动与UCLA联合发布了一项名为Self-Forcing++的AI技术,成功突破分钟级长视频生成瓶颈,最长可生成4分15秒高质量视频,较现有5-10秒生成能力提升近50倍。该方法无需更换模型架构或重新收集数据集,通过反向噪声初始化、扩展分布匹配蒸馏和滚动KV缓存训练等创新优化,显著抑制了长视频后期画质下降问题。实验显示,Self-Forcing++在语义一致性、视觉稳定性和动态表现上全面领先CausVid、SkyReels等基准模型,且支持开源。研究人员还引入Gemini-2.5-Pro作为评估工具,进一步提升了评价准确性。这一技术或将推动AI电影时代的到来。
数据炼金师
10-06 14:37:37
分享至
打开微信扫一扫
内容投诉
生成图片
首发根据音频生成 4K 分辨率 1 小时长视频,复旦、百度联手打造 AI 开源模型 Hallo2
正文:复旦大学与百度联合研发的AI模型Halio2于10月21日开源发布。该模型能生成长达一小时、分辨率为4K的人物动画视频,显著提升了长视频生成的质量与稳定性。Halio2基于latent diffusion models,并采用patch-drop和高斯噪声的数据增强技术,增强了长时间视频的视觉一致性和时间连贯性。同时,Halio2融合了向量量化生成对抗网络和时间对齐技术,确保了高分辨率视频的质量和流畅度。此外,Halio2还支持通过文本标签来调整肖像表情,增加了生成内容的多样性和可控性。这是首款能够生成如此高质量、长时长视频的AI模型,标志着AI技术在视频生成领域的重大突破。项目地址:
阿达旻
10-21 10:24:56
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序