3月29日,清华大学人工智能研究院副院长、生数科技创始人朱军发布高可控视频大模型Vidu Q1,这是业内首个高可控AI视频大模型。Vidu Q1在多主体细节可控(动作、布局)、音效同步可控及画质增强方面表现突出。它能根据语义指令和参考图,精准调整多主体位置、大小、运动轨迹以及所有动作行为(如出场、退场、坐姿等)。此外,Vidu Q1具备音效同步功能,可根据视频环境生成并控制风声、雨声等音效的长短与时长节点,如0-2秒风声、3-5秒雨声。
原文链接
本文链接:https://kx.umi6.com/article/16405.html
转载请注明文章出处
相关推荐
换一换
原字节跳动AI大将骆怡航离职 出任视频生成独角兽生数科技CEO
2025-03-12 14:27:29
多模态AI创企生数科技再获数亿元融资 文生视频商业化进入加速期
2025-09-19 10:08:56
生数科技发布高可控视频大模型 Vidu Q1:可精准调整所有动作行为
2025-03-29 18:54:11
华为哈勃入股生数科技
2024-06-26 22:55:38
穿过DeepSeek的窄门
2025-05-07 09:06:34
生数科技再获数亿元大额融资,Vidu领跑多模态大模型赛道
2025-09-19 11:12:21
“中国版Sora”视频大模型Vidu重大更新:时长延至32秒,首次支持音视频合成
2024-06-06 19:58:59
文生视频爆发 生数科技商业化重点仍在B端市场
2024-09-12 08:45:24
字节AI高管骆怡航任清华系公司生数科技CEO,原CEO发文:人生就是不停地告别
2025-03-12 13:25:58
全球首发!Vidu 让任意主体保持一致,视频生成进入新阶段!
2024-09-12 15:51:26
智谱与生数科技达成战略合作
2025-04-27 15:29:57
生数科技加速商业化,字节跳动AI大将骆怡航加盟出任CEO
2025-03-12 12:19:20
“清华系Sora”全球上线,生成一段视频只需30秒,每月仅需58元
2024-07-31 18:20:02
679 文章
459111 浏览
24小时热文
更多
-
2026-02-06 03:31:10 -
2026-02-06 03:31:07 -
2026-02-06 03:30:07