3月29日,清华大学人工智能研究院副院长、生数科技创始人朱军发布高可控视频大模型Vidu Q1,这是业内首个高可控AI视频大模型。Vidu Q1在多主体细节可控(动作、布局)、音效同步可控及画质增强方面表现突出。它能根据语义指令和参考图,精准调整多主体位置、大小、运动轨迹以及所有动作行为(如出场、退场、坐姿等)。此外,Vidu Q1具备音效同步功能,可根据视频环境生成并控制风声、雨声等音效的长短与时长节点,如0-2秒风声、3-5秒雨声。
原文链接
本文链接:https://kx.umi6.com/article/16405.html
转载请注明文章出处
相关推荐
换一换
“清华系Sora”全球上线,生成一段视频只需30秒,每月仅需58元
2024-07-31 18:20:02
智谱与生数科技达成战略合作
2025-04-27 15:29:57
国产文生视频大模型 Vidu 将迎更新:支持生成 32 秒内容、音视频合成
2024-06-07 15:06:57
华为哈勃入股生数科技
2024-06-26 22:55:38
文生视频爆发 生数科技商业化重点仍在B端市场
2024-09-12 08:45:24
原字节跳动AI大将骆怡航离职 出任视频生成独角兽生数科技CEO
2025-03-12 14:27:29
全球首发!Vidu 让任意主体保持一致,视频生成进入新阶段!
2024-09-12 15:51:26
多模态AI创企生数科技再获数亿元融资 文生视频商业化进入加速期
2025-09-19 10:08:56
清华系智谱×生数达成战略合作,专注大模型联合创新
2025-04-27 15:19:08
一致性对标Nano Banana,国产Vidu Q1同时支持7张参考 | 实测
2025-09-10 13:35:53
生数科技再获数亿元大额融资,Vidu领跑多模态大模型赛道
2025-09-19 11:12:21
字节AI高管骆怡航任清华系公司生数科技CEO,原CEO发文:人生就是不停地告别
2025-03-12 13:25:58
AI模仿人类看漫画,视频大模型时序定位能力新SOTA
2024-11-23 12:23:27
574 文章
276404 浏览
24小时热文
更多
-
2025-10-24 22:57:14 -
2025-10-24 21:54:02 -
2025-10-24 21:53:50