1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8月26日,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V。该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、动作流畅的电影级数字人视频,单次生成时长可达分钟级,大幅提升视频创作效率。模型支持真人、卡通、动物等多类型图片及肖像、半身、全身画幅,还可通过文本控制丰富视频内容。例如,上传人物弹钢琴照片、歌曲和文字,可生成高质量演奏视频,手指动作与音频节奏完美匹配。技术上,Wan2.2-S2V融合音频驱动和文本引导机制,采用层次化帧压缩技术实现稳定长视频生成,训练数据集超60万个音视频片段。实测显示其在FID、EFID、CSIM等指标上领先同类模型。自今年2月以来,通义万相已开源多款模型,下载量超2000万。

原文链接
本文链接:https://kx.umi6.com/article/24239.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
字节视频生成模型 PixelDance上线即梦AI,用户可免费体验
2024-11-18 22:29:52
快手抖音争相上桌,AI短剧何以成为香饽饽?
2024-07-17 20:29:10
豆包视频生成模型Seedance 2.0上线
2026-02-12 13:23:21
阿里开源电影级视频生成模型通义万相2.2
2025-07-28 21:20:36
字节跳动推出视频生成模型OmniHuman-1.5
2025-08-28 21:29:35
豆包发布视频生成模型Seedance1.0 pro
2025-06-11 12:13:43
二次元狂喜!海螺发布2D动画专用视频生成模型,日漫迪士尼插画风都支持
2024-12-09 15:27:23
AI恐怖体操视频腿脚乱飞、大变活人,LeCun:视频生成模型根本不懂物理
2024-07-01 18:07:59
Sora之后,视频生成模型的中国牌局
2024-12-12 10:52:54
智谱 AI 开源 CogVideoX 视频生成模型:“清影”同源,单张 4090 显卡可推理
2024-08-06 13:21:18
通义万相全新动作生成模型开源
2025-09-19 15:17:03
今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了
2025-01-09 12:54:09
阿里开源视频生成模型Wan2.2-S2V
2025-08-26 22:55:59
24小时热文
更多
扫一扫体验小程序