把Runway、Luma们一锅端了!这款视频模型上“杀手级”功能:一致性魔咒终于打破
三张图攒一个毫无违和感的视频!
视频模型领域再掀波澜,国产视频模型Vidu凭借其新功能“多主体一致性”打破了业界难题。
多主体一致性功能
Vidu的新功能支持上传1~3张参照图,以实现对多主体的精准控制。例如,上传“黑人男子、机甲、城市街景”三张图,Vidu能将三者无缝融合,生成一段“男子穿着机甲走在城市街道”的视频。
改变游戏规则
这一功能让海外用户直呼“改变了游戏规则”。未来只需上传角色图和环境图,即可创作连续视频故事。例如,上传女战士形象图和战场场景,就能生成史诗级战争画面。Vidu还能处理复杂的多主体场景,如生成108将群像视频。
一致性魔咒的突破
此前,Runway、Luma AI等视频模型仅支持单图输入,难以确保多主体间的一致性。Vidu不仅解决了单主体一致性问题,还能控制多主体间的自然交互,这在业界尚属首次。
如何正确使用
Vidu支持单主体和多主体的一致性视频生成。例如,上传不同角度的人物照片,Vidu能精准控制单主体的每个细节。此外,Vidu还能融合人物与道具、场景,生成逼真的视频内容。
技术创新
Vidu的技术架构采用统一化方案,将所有问题简化为(视觉输入,视觉输出)。这种设计减少了微调训练的需求,提升了模型的泛化能力,使其无需专门数据采集和标注,仅靠少量图像就能实现高可控输出。
上下文记忆能力
Vidu在理解多个输入图像的含义及其关联性方面表现出色,能够生成连贯且有逻辑的视频内容,类似于大语言模型的“上下文学习”能力。这使得Vidu不仅是一个渲染工具,还能在生成过程中管理上下文信息。
传送门:www.vidu.studio
原文链接
本文链接:https://kx.umi6.com/article/8728.html
转载请注明文章出处
相关推荐
换一换
120 秒生成 120 帧,视频模型 Dream Machine 开放测试免费试用
2024-06-13 11:47:03
文生视频公司Pika获新一轮8000万融资,估值达4.7亿美元
2024-06-06 19:53:53
阿里发布电影级视频模型万相2.6
2025-12-16 13:40:51
57.1%的人分不清真假!Runway新视频模型太爆炸
2026-01-22 14:56:01
不是视频模型“学习”慢,而是LLM走捷径|18万引大牛Sergey Levine
2025-06-10 17:50:38
Midjourney发布视频模型:不卷分辨率,但网友直呼画面惊艳
2025-06-19 15:51:06
我们试了市面上八款视频模型,发现Sora 确实不太行了
2024-12-30 18:28:36
随身AI算力!华硕推出UGen300 USB加速器:即插即用 随处部署
2026-04-03 17:12:18
首部AIGC国宝文物科普少儿动画开播
2026-04-03 18:14:13
Linux内核维护者崩溃了!AI每天狂塞10份漏洞报告,想摸会鱼都难
2026-04-05 10:47:29
优必选科技招募首席科学家 年薪1500万元人民币起步 最高可达1.24亿
2026-04-03 12:19:39
中广联演员委员会就AI换脸合成发声明
2026-04-02 17:12:01
阿里发布新一代模型Qwen3.6-Plus 编程表现接近全球最强编程模型
2026-04-02 12:58:45
672 文章
521777 浏览
24小时热文
更多
-
2026-04-05 22:13:40 -
2026-04-05 18:03:06 -
2026-04-05 18:01:58