3月29日,清华大学人工智能研究院副院长、生数科技创始人朱军发布高可控视频大模型Vidu Q1,这是业内首个高可控AI视频大模型。Vidu Q1在多主体细节可控(动作、布局)、音效同步可控及画质增强方面表现突出。它能根据语义指令和参考图,精准调整多主体位置、大小、运动轨迹以及所有动作行为(如出场、退场、坐姿等)。此外,Vidu Q1具备音效同步功能,可根据视频环境生成并控制风声、雨声等音效的长短与时长节点,如0-2秒风声、3-5秒雨声。
原文链接
本文链接:https://kx.umi6.com/article/16405.html
转载请注明文章出处
相关推荐
.png)
换一换
“清华系Sora”全球上线,生成一段视频只需30秒,每月仅需58元
2024-07-31 18:20:02
清华系智谱×生数达成战略合作,专注大模型联合创新
2025-04-27 15:19:08
字节AI高管骆怡航任清华系公司生数科技CEO,原CEO发文:人生就是不停地告别
2025-03-12 13:25:58
「生数科技」完成数亿元Pre-A轮融资,百度投了 | 36氪首发
2024-06-06 16:27:59
AI模仿人类看漫画,视频大模型时序定位能力新SOTA
2024-11-23 12:23:27
“中国版Sora”视频大模型Vidu重大更新:时长延至32秒,首次支持音视频合成
2024-06-06 19:58:59
智谱与生数科技达成战略合作
2025-04-27 15:29:57
生数科技加速商业化,字节跳动AI大将骆怡航加盟出任CEO
2025-03-12 12:19:20
原字节跳动AI大将骆怡航离职 出任视频生成独角兽生数科技CEO
2025-03-12 14:27:29
生数科技CEO唐家渝:“人人可用”的视频大模型在2025年将成为现实|AI领先者心声・2025
2025-01-09 19:06:04
华为哈勃入股生数科技
2024-06-26 22:55:38
国产文生视频大模型 Vidu 将迎更新:支持生成 32 秒内容、音视频合成
2024-06-07 15:06:57
穿过DeepSeek的窄门
2025-05-07 09:06:34
527 文章
174283 浏览
24小时热文
更多

-
2025-09-06 16:37:17
-
2025-09-06 16:36:53
-
2025-09-06 16:36:08