3月29日,清华大学人工智能研究院副院长、生数科技创始人朱军发布高可控视频大模型Vidu Q1,这是业内首个高可控AI视频大模型。Vidu Q1在多主体细节可控(动作、布局)、音效同步可控及画质增强方面表现突出。它能根据语义指令和参考图,精准调整多主体位置、大小、运动轨迹以及所有动作行为(如出场、退场、坐姿等)。此外,Vidu Q1具备音效同步功能,可根据视频环境生成并控制风声、雨声等音效的长短与时长节点,如0-2秒风声、3-5秒雨声。
原文链接
本文链接:https://kx.umi6.com/article/16405.html
转载请注明文章出处
相关推荐
.png)
换一换
字节AI高管骆怡航任清华系公司生数科技CEO,原CEO发文:人生就是不停地告别
2025-03-12 13:25:58
清华系智谱×生数达成战略合作,专注大模型联合创新
2025-04-27 15:19:08
国产文生视频大模型 Vidu 将迎更新:支持生成 32 秒内容、音视频合成
2024-06-07 15:06:57
456 文章
64567 浏览
24小时热文
更多

-
2025-07-20 17:06:49
-
2025-07-20 16:05:44
-
2025-07-20 16:05:36