3月29日,清华大学人工智能研究院副院长、生数科技创始人朱军发布高可控视频大模型Vidu Q1,这是业内首个高可控AI视频大模型。Vidu Q1在多主体细节可控(动作、布局)、音效同步可控及画质增强方面表现突出。它能根据语义指令和参考图,精准调整多主体位置、大小、运动轨迹以及所有动作行为(如出场、退场、坐姿等)。此外,Vidu Q1具备音效同步功能,可根据视频环境生成并控制风声、雨声等音效的长短与时长节点,如0-2秒风声、3-5秒雨声。
原文链接
本文链接:https://kx.umi6.com/article/16405.html
转载请注明文章出处
相关推荐
换一换
文生视频爆发 生数科技商业化重点仍在B端市场
2024-09-12 08:45:24
穿过DeepSeek的窄门
2025-05-07 09:06:34
智谱与生数科技达成战略合作
2025-04-27 15:29:57
多模态AI创企生数科技再获数亿元融资 文生视频商业化进入加速期
2025-09-19 10:08:56
一致性对标Nano Banana,国产Vidu Q1同时支持7张参考 | 实测
2025-09-10 13:35:53
AI模仿人类看漫画,视频大模型时序定位能力新SOTA
2024-11-23 12:23:27
生数科技加速商业化,字节跳动AI大将骆怡航加盟出任CEO
2025-03-12 12:19:20
字节AI高管骆怡航任清华系公司生数科技CEO,原CEO发文:人生就是不停地告别
2025-03-12 13:25:58
生数科技再获数亿元大额融资,Vidu领跑多模态大模型赛道
2025-09-19 11:12:21
生数科技完成近20 亿元 B 轮融资,以通用世界模型定义下一代数字与物理世界生产力底座
2026-04-10 16:18:48
生数科技CEO唐家渝:“人人可用”的视频大模型在2025年将成为现实|AI领先者心声・2025
2025-01-09 19:06:04
重构AI在数字和物理世界的生产力,生数科技完成超6亿元A+轮融资
2026-02-06 03:28:59
华为哈勃入股生数科技
2024-06-26 22:55:38
747 文章
669089 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41