8月26日,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V。该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、动作流畅的电影级数字人视频,单次生成时长可达分钟级,大幅提升视频创作效率。模型支持真人、卡通、动物等多类型图片及肖像、半身、全身画幅,还可通过文本控制丰富视频内容。例如,上传人物弹钢琴照片、歌曲和文字,可生成高质量演奏视频,手指动作与音频节奏完美匹配。技术上,Wan2.2-S2V融合音频驱动和文本引导机制,采用层次化帧压缩技术实现稳定长视频生成,训练数据集超60万个音视频片段。实测显示其在FID、EFID、CSIM等指标上领先同类模型。自今年2月以来,通义万相已开源多款模型,下载量超2000万。
原文链接
本文链接:https://kx.umi6.com/article/24239.html
转载请注明文章出处
相关推荐
换一换
潞晨科技推出开源视频生成模型Open-Sora 2.0
2025-03-13 15:25:51
AI恐怖体操视频腿脚乱飞、大变活人,LeCun:视频生成模型根本不懂物理
2024-07-01 18:07:59
OpenAI 深夜炸场:家族最强视频生成模型 Sora 2 发布,还能同步生成音频
2025-10-01 08:39:42
阿里巴巴开源视频生成模型通义万相 Wan2.2,首创电影美学控制系统
2025-07-28 21:19:42
阿里通义万相视觉生成大模型升级,支持文生视频、图生视频等
2024-09-19 16:54:30
潞晨科技推出开源视频生成模型 Open-Sora 2.0,性能接近 OpenAI Sora
2025-03-13 14:24:23
字节视频生成模型 PixelDance上线即梦AI,用户可免费体验
2024-11-18 22:29:52
国产AI让普通人也能当导演 字节Seedance 2.0获央视点赞
2026-02-14 23:51:12
智谱AI版Sora开源!首个可商用,在线可玩,5小时GitHub狂揽3.7K星
2024-08-06 12:40:56
Sora/可灵/海螺/混元大PK!多场景对比,谁是最强视频生成模型?
2024-12-11 17:28:14
阿里开源视频生成模型Wan2.2-S2V
2025-08-26 22:55:59
火山引擎发布豆包视频生成模型Seedance 1.0 lite
2025-05-13 15:58:04
今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了
2025-01-09 12:54:09
721 文章
560535 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17