腾讯混元团队与中山大学、香港科技大学合作推出了全新的图生视频模型Follow-Your-Pose-v2,它革新了视频生成技术。以前,单一人物动作易实现,但现在,只需一张人物合照,多人就能同步“舞动”。这款模型有四大亮点:支持多人动作生成、具有强泛化能力、能用生活照和抓拍训练,且能处理遮挡问题,生成前后一致的画面。模型在多角色生成效果上超越现有技术35%以上,尤其在动作跟踪和视觉质量上表现出色。其创新之处在于使用嘈杂开源视频训练,结合光流、深度图和推理图指导器,提升了模型的稳定性和质量。这一技术在AIGC领域有广阔的应用前景,腾讯混元团队还发布了加速库,降低了使用门槛。相关论文和模型库可供进一步研究。
原文链接
本文链接:https://kx.umi6.com/article/1075.html
转载请注明文章出处
相关推荐
换一换
腾讯混元技术负责人刘威离职创业 瞄准视频生成领域
2024-11-19 16:52:19
预定最强视频生成 AI 模型,OpenAI Sora 2 现踪迹
2025-07-24 11:05:38
阿里通义万相 2.1 模型宣布升级:首次实现中文文字视频生成功能,支持无限长 1080P 视频的高效编解码
2025-01-10 11:16:50
低端显卡登上AI的大船!6GB显存就能生成高质量视频
2025-04-20 23:22:18
OpenAI 拟将视频生成工具 Sora 整合进 ChatGPT,并推出更强大 Sora Turbo
2025-03-01 10:50:58
11B模型拿开源视频生成SOTA!仅用224张GPU训练,训练成本省10倍
2025-03-13 13:15:44
全栈AI基础设施支撑,跑出全球首个开放使用视频生成DiT模型
2025-04-28 11:46:30
新版Sora要来了?泄露视频引围观
2024-12-09 17:32:14
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
2024-12-03 16:22:39
快手发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型
2025-04-15 15:33:39
AI的下个进化和爆点
2024-07-29 09:23:23
昆仑万维开源 SkyReels-V2 模型,开启生成“无限时长”视频时代
2025-04-21 15:45:45
全球首个无限时长视频生成!新扩散模型引爆万亿市场,电影级理解,全面开源
2025-04-21 16:45:29
678 文章
468303 浏览
24小时热文
更多
-
2026-03-10 09:02:22 -
2026-03-10 09:01:12 -
2026-03-10 09:00:02