1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8月26日,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V。该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、动作流畅的电影级数字人视频,单次生成时长可达分钟级,大幅提升视频创作效率。模型支持真人、卡通、动物等多类型图片及肖像、半身、全身画幅,还可通过文本控制丰富视频内容。例如,上传人物弹钢琴照片、歌曲和文字,可生成高质量演奏视频,手指动作与音频节奏完美匹配。技术上,Wan2.2-S2V融合音频驱动和文本引导机制,采用层次化帧压缩技术实现稳定长视频生成,训练数据集超60万个音视频片段。实测显示其在FID、EFID、CSIM等指标上领先同类模型。自今年2月以来,通义万相已开源多款模型,下载量超2000万。

原文链接
本文链接:https://kx.umi6.com/article/24239.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Sora之后,视频生成模型的中国牌局
2024-12-12 10:52:54
拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?
2025-06-20 17:04:19
潞晨科技推出开源视频生成模型Open-Sora 2.0
2025-03-13 15:25:51
潞晨科技推出开源视频生成模型 Open-Sora 2.0,性能接近 OpenAI Sora
2025-03-13 14:24:23
阿里巴巴开源视频生成与编辑模型通义万相 Wan2.1-VACE
2025-05-16 14:14:59
阿里开源电影级视频生成模型通义万相2.2
2025-07-28 21:20:36
智谱AI版Sora开源!首个可商用,在线可玩,5小时GitHub狂揽3.7K星
2024-08-06 12:40:56
Runway 发布第三代视频生成模型,90 秒生成 10 秒片段
2024-06-18 11:29:52
一张图即可生成电影级数字人视频:阿里云通义万相 Wan2.2-S2V 视频生成模型宣布开源
2025-08-26 22:53:42
谷歌 Veo 3.1 视频生成模型发布:新增音频支持、对象添加等功能
2025-10-16 07:47:17
二次元狂喜!海螺发布2D动画专用视频生成模型,日漫迪士尼插画风都支持
2024-12-09 15:27:23
60秒内生成5秒AI视频 豆包视频生成模型Seaweed上线即梦AI
2024-11-08 18:32:50
AI恐怖体操视频腿脚乱飞、大变活人,LeCun:视频生成模型根本不懂物理
2024-07-01 18:07:59
24小时热文
更多
扫一扫体验小程序