1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8月26日,阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V。该模型仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致、动作流畅的电影级数字人视频,单次生成时长可达分钟级,大幅提升视频创作效率。模型支持真人、卡通、动物等多类型图片及肖像、半身、全身画幅,还可通过文本控制丰富视频内容。例如,上传人物弹钢琴照片、歌曲和文字,可生成高质量演奏视频,手指动作与音频节奏完美匹配。技术上,Wan2.2-S2V融合音频驱动和文本引导机制,采用层次化帧压缩技术实现稳定长视频生成,训练数据集超60万个音视频片段。实测显示其在FID、EFID、CSIM等指标上领先同类模型。自今年2月以来,通义万相已开源多款模型,下载量超2000万。

原文链接
本文链接:https://kx.umi6.com/article/24239.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里AI视频大模型HappyHorse预计一周后对外发布
2026-04-10 11:06:15
Sora/可灵/海螺/混元大PK!多场景对比,谁是最强视频生成模型?
2024-12-11 17:28:14
国产AI让普通人也能当导演 字节Seedance 2.0获央视点赞
2026-02-14 23:51:12
豆包发布视频生成模型Seedance1.0 pro
2025-06-11 12:13:43
阿里发布通义 Wan2.2-I2V-Flash 模型:推理速度比 Wan2.1 提升 12 倍,图生视频更轻快
2025-08-11 16:07:50
美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分钟级内容
2025-10-27 11:55:56
最强开源短剧创作模型来了!33种表情、400种肢体动作,好莱坞级AI导演监制
2025-02-20 11:08:49
视频生成模型大盘点:谁能定义下一代内容?
2025-08-07 20:57:55
字节跳动 OmniHuman 多模态视频生成模型即将上线,图片 + 音频便可生成视频
2025-02-07 18:02:50
阿里开源电影级视频生成模型通义万相2.2
2025-07-28 21:20:36
火山引擎发布豆包视频生成模型Seedance 1.0 lite
2025-05-13 15:58:04
通义万相全新动作生成模型开源
2025-09-19 15:17:03
阿里开源版Sora上线即屠榜,4070就能跑,免费商用
2025-02-26 16:37:10
24小时热文
更多
扫一扫体验小程序